如何用信息抽取技术辨别真伪
发布网友
发布时间:2024-10-08 22:12
我来回答
共1个回答
热心网友
时间:2024-10-17 07:42
不知道你是要辨别什么的真伪,是辨别论文还是投稿的风格是否是摘抄的吗?
一般来说有2种方法。
1,建立全文对照库,将你要辨别的文章打散了和对照库里的一一对照,将长度大于多少的句子提取出来,由此来判断是否是原创或是否伪作。一般来说这是针对大众的识别,需要很高的成本才能做到。
2,建立模式库,这种方法一般用来针对个人,需要将某个或某群人的作品尽可能多的收集起来,然后分析这些作品里的常用词语、语法习惯、语气词等,(这里需要专业的鉴定专家来把握)分别赋上不同的值,最后将要鉴定的东西输入进去分析,看看里面到底出现了多少符合模式库的特征,以此来判断是否伪作。这种方法还可以用来识别画画或者音乐作品(理论上)。