文本自动摘要工具 TextTeaser 开源

jopen 10年前

文本自动摘要API TextTeaser日前开源,登陆GitHubTechCrunch早在2013年10月对TextTeaser进行过最早的报道。其创造者霍洛•巴尔宾(Jolo Balbin)表示,在“发现一些扩展问题,特别是API中的问题后”,他决定将TextTeaser代码开源。

于是他撤下API,对TextTeaser进行重构,以加快了它的自动摘要速度。开发者可以从两套方案中进行选择,包括每摘要1000篇文章付费12美元的方案。第二种方案针对企业,费用为每月250美元,会有专门的服务器存储文章来源。这意味着每当人们使用该工具对文章摘要,TextTeaser就能获知文本中的关键字,并利用这类信息来改善它的效果。

“透过这一TextTeaser,你可以训练你自己的摘要工具。”巴尔宾解释道,“你可以提供文章的类别和来源,用以改进摘要的质量。未来,用户可能也将能够提供哪些关键字重要哪些不重要方面的信息。”

开发者已经将TextTeaser整合到包括Gist在内的多款新闻阅读类应用当中。巴尔宾还计划针对财务、医疗和法律方面的文件优化TextTeaser,那些领域的文件往往非常冗长,易读性低。

如想了解下TextTeaser的功能与效果,可以看看它对《饥饿游戏》的摘要以及巴尔宾的这篇博文。(译:羽腾)

来自:TechCrunch