如何用信息抽取技术辨别真伪

发布网友 发布时间:2024-10-08 22:12

我来回答

1个回答

热心网友 时间:2024-10-17 07:42

不知道你是要辨别什么的真伪,是辨别论文还是投稿的风格是否是摘抄的吗?

一般来说有2种方法。
1,建立全文对照库,将你要辨别的文章打散了和对照库里的一一对照,将长度大于多少的句子提取出来,由此来判断是否是原创或是否伪作。一般来说这是针对大众的识别,需要很高的成本才能做到。
2,建立模式库,这种方法一般用来针对个人,需要将某个或某群人的作品尽可能多的收集起来,然后分析这些作品里的常用词语、语法习惯、语气词等,(这里需要专业的鉴定专家来把握)分别赋上不同的值,最后将要鉴定的东西输入进去分析,看看里面到底出现了多少符合模式库的特征,以此来判断是否伪作。这种方法还可以用来识别画画或者音乐作品(理论上)。
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
Top