您的位置:首页 > 软件教程 > 教程 > 使用Label-Studio进行数据标注

使用Label-Studio进行数据标注

来源:好特整理 | 时间:2024-06-20 11:49:05 | 阅读:84 |  标签: T cat | El S C   | 分享到:

目录安装运行 doccano打开 doccanno创建项目上传数据定义标签添加成员开始标注导出数据查看数据统计 数据标注工具 Label-Studio 安装 打开命令行(cmd、terminal)执行安装命令 # Python 3.8+ pip install doccano -i https://

数据标注工具 Label-Studio

Label-Studio是一个用于数据标注的工具。它提供了一个简单易用的界面,可以帮助用户进行各种类型的数据标注工作,如文本分类、命名实体识别、关系抽取等。

安装

要安装Label-Studio,首先需要在命令行(cmd、terminal)执行以下安装命令:

# Python 3.8+
pip install doccano -i https://pypi.tuna.tsinghua.edu.cn/simplelabel

使用Label-Studio进行数据标注

运行 doccano

安装完成后,可以通过以下命令来运行Label-Studio:

#在电脑第一次运行的时候初始化doccano
#只需设置一次,之后不用再运行该命令
doccano init

#创建用户名及密码;例如现在有一个主管admin,1个标注员vipsoft
doccano createuser --username admin --password 123456
doccano createuser --username vipsoft --password 123456

#开启doccano服务
doccano webserver

完成上述操作后,另打开一个新的命令行,执行下列命令:

# In another terminal, run the command:
doccano task

使用Label-Studio进行数据标注
使用Label-Studio进行数据标注

打开 doccanno

在浏览器里输入:
http://localhost:8000/
支持中文,挺好
使用Label-Studio进行数据标注
输入用户名密码:
使用Label-Studio进行数据标注

创建项目

Label-Studio支持抽取式任务项目创建和分类式任务项目创建。为了创建项目,可以按照以下步骤进行:

  • 抽取式任务项目创建

    适配命名实体识别、关系抽取、事件抽取、评价观点抽取等任务

  • 分类式任务项目创建

    适配文本分类、句子级情感倾向分类等任务。

为创建项目,如图点击Create按钮。根据需要选择合适的项目类别,这里选择 文本分类 Text Classification
使用Label-Studio进行数据标注
使用Label-Studio进行数据标注
使用Label-Studio进行数据标注

上传数据

可以通过以下链接下载实验数据:
https://hidadeng.github.io/blog/doccano_text_anotation/data.csv
使用Label-Studio进行数据标注

上传数据
使用Label-Studio进行数据标注
下面的 review 对应 csv 里的列
使用Label-Studio进行数据标注
使用Label-Studio进行数据标注

定义标签

点击左侧菜单中的“Labels”按钮来定义标签。在标签编辑器页面中,可以通过指定标签文本、快捷键、背景颜色和文本颜色来创建标签。
使用Label-Studio进行数据标注
同理,可以定义负面neg标签。现在有了pos和neg两个标签。
使用Label-Studio进行数据标注

添加成员

点击左侧目录中的 Members 按钮,然后,选择“Add”按钮以显示表单。使用您要添加到项目中的用户名和角色填写此表单。然后,选择“Save”按钮。如果没有可供选择的成员,记得创建成员。 doccano createuser --username tom --password 123456
使用Label-Studio进行数据标注

开始标注

点击导航栏中的 Start annotation 按钮,开始对文档进行批注了
使用Label-Studio进行数据标注

导出数据

到“Dataset”页面,然后单击“操作”菜单中的“Export dataset”按钮。选择导出格式后,单击“Export”。
使用Label-Studio进行数据标注

查看数据

import pandas as pd

df = pd.read_csv('all.csv')
df

使用Label-Studio进行数据标注

统计

使用Label-Studio进行数据标注

小编推荐阅读

好特网发布此文仅为传递信息,不代表好特网认同期限观点或证实其描述。

相关视频攻略

更多

扫二维码进入好特网手机版本!

扫二维码进入好特网微信公众号!

本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件admin@haote.com

湘ICP备2022002427号-10 湘公网安备:43070202000427号© 2013~2024 haote.com 好特网