Stage1st

 找回密码
 立即注册
搜索
查看: 3997|回复: 13
打印 上一主题 下一主题

[欢乐] 一个关于NLP的问题,求解

[复制链接]
     
楼主
发表于 2024-3-16 02:13 | 显示全部楼层
我没看太明白这个目录是指的directory还是index, 但你是不是想整个文本主题分类器?
回复

使用道具 举报

     
2#
发表于 2024-3-16 02:40 | 显示全部楼层
zuckmydik 发表于 2024-3-16 02:28
大概是类似于“计算及控制芯片”“驱动芯片”“通讯芯片”这种已经定好的分类目录吧 ...

我能不能这么理解:
你有一些语料(比如一堆文档),大致可以分为 计算及控制芯片/ 驱动芯片/ 通讯芯片 etc 这么几个手工设定的大类。
现在你希望有一个文本主题分类器, 可以输入语料然后输出一个该语料所属的分类, 然后把这个文件移动到对应分类的文件夹目录中去?

是这样的需求吗?
回复

使用道具 举报

     
3#
发表于 2024-3-17 04:30 | 显示全部楼层
zuckmydik 发表于 2024-3-17 00:45
对的。不过不是把文件移动到某个目录下,而是给予她某个目录的标签,因为一个语料符合条件下可以有多个目 ...

7楼说得对, 你的输出应该是张表, 结果应为这样的形式:

文档名       分类结果
C:\文档A    计算及控制芯片, 驱动芯片
C:\文档B    通讯芯片, 驱动芯片, 计算及控制芯片
C:\文档C    驱动芯片
C:\文档D    皮衣黄炒狗芯片, 通讯芯片

感觉使用主题分类器即可, 输出一个语料文档所有分类概率大于85%的分类标签就可以得到↑这张表
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-5-12 09:49 , Processed in 0.017254 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表