-
Notifications
You must be signed in to change notification settings - Fork 329
Frontend Procedure
Guan Wang edited this page Nov 24, 2017
·
1 revision
Text Classification
所有数据均未打上标签(label) 导入数据 可以将数据 按照需要标注的格式 一次性导入到dataset表中
已经有训练过的model
前端传过来的请求参数(request param)
{
"_id":ObjectId("dfjl32jljfdlsjldf"),
"label":"org",
"action","accept"
}
accept: 根据_id 更新 dataset表数据
同时将操作保存到history表中
调用/models/online当中的方法:
def do_online_annotation(text, ):
"""
@param text 待标注文本
"""
return {"label":"org"}
表: dataset 目标数据集
{
"_id": ObjectId("dfjl32jljfdlsjldf")
"text":"联想",
"label":"org",
"confidence":.9,
"labeled":true/false # 是否标注过,
"source":"newyork news"
}
表: history 单条标注的操作记录
{
"_id": ObjectId("dfjl32jljfdlsjldf") # 关联到to_be_labeled
"action":"accept" # enum type: accept reject ignore cancel
"datatime":"2017-11-13 15:13:24" # 操作的时间
}
{
"code": 200, # 状态码 200:成功
"msg": "标注成功", # 提示信息
"data":{} # 后端返回的dataset
}
例如: 后端api返回 标注成功
前端页面再次加载dataset表中 未标注的数据到前端
Mongodb系统自动触发 无需用户干预
调用/models/offline当中的方法:
def do_offline_annotation(collection, ):
"""
@param collection 待标注的表名称
"""
return {"label":"org"}
在/config包中 添加配置文件 暂定使用python文件作为配置文件
例如: config.py
TRIGGER_OFFLINE_BATCH_SIZE = 1000 # 触发offline计算的阀值