学生开发软件识别讽刺

jopen 8年前

一组参加康奈尔大学科技挑战项目的学生开发出机器学习软件,尝试破解语言处理的最后疆域:识别讽刺。他们开发的软件叫 TrueRatr,源代码托管在 Github 上,设计识别产品评论中的讽刺。

彭博的 Christopher Hong 是学生们的导师,他的硕士论文主题就是研究讽刺检测。他说,每个人在某个点都会使用讽刺,有时候是为了中伤,有时则是相反,这几乎是人性的一部分。但讽刺很难定义。在 Hong 的研究中,他寻找某种“情绪转变”——在同一句话中同时使用负面和正面词。利用某种情感分析,他的系统识别精度达到了 71%,比掷硬币好很多。

来自: Solidot