文章

java中文文本信息处理从海量到精准-罗刚-张子宪-崔智杰编著

书籍简介

本书以让零基础的读者通过自学完成一个中文分词系统为目标,从Java基础语法开始讲解,然后介绍文本处理相关的数据结构和算法,最后介绍如何实现文本切分和词性标注本书是介绍业界热门的以Java开发中文分词技术的唯一书籍。本书选取相关领域的经典内容,深入理解和挖掘,也综合了实践性强的创新想法,适合对软件开发感兴趣的青少年或者大学生阅读和学习. “前门到了,请在后门下车。”把“前门”标注成地名就容易理解这句话了。从种地到买菜、买房、养生保健以及投资理财等,都可以用到中文分词等文本信息挖掘技术。各行业都在构建越来越复杂的软件系统,很多系统都会用到文本处理技术。但是即使在计算机专业,也有很多人对文本信息处理相关技术不太了解。其实,学习相关技术的门槛并不高。而本书就是为了普及相关开发而做的一次新的尝试,其中也结合了作者自己的研究成果,希望为推动相关应用的发展做出贡献. 本书借助计算机语言Java实现中文文本信息处理,试图通过恰当的数据结构和算法来应对一些常见的文本处理任务。相关代码可以从清华大学出版社的网站下载本书的第1章到第3章介绍了相关的Java开发基础。第4章介绍处理文本所用到的有限状态机基本概念和具体实现。第5章介绍相关的基础数据结构。第6章到第9章介绍中文分词原理与实现。 书中的很多内容来源于作者的开发和教学实践。作者的实践经验还体现在相关的其他书中,如《自己动手写搜索引擎》、《自然语言处理原理与技术实现》、《自己动手写网 《解密搜索引擎技术实战》等。相对于作者编写的络爬虫》、《使用C#开发搜索引擎》其他书籍,本书更加注意零基础入门。

书籍封面

下载地址

[c-downbtn type="default" url="https://pan.quange.cc/d/quange/%E8%B5%84%E6%BA%90%E5%88%86%E4%BA%AB/%E4%B9%A6%E7%B1%8D%E5%88%86%E4%BA%AB/%E5%BC%80%E5%8F%91/java/Java/Java%E4%B8%AD%E6%96%87%E6%96%87%E6%9C%AC%E4%BF%A1%E6%81%AF%E5%A4%84%E7%90%86%EF%BC%88%E4%BB%8E%E6%B5%B7%E9%87%8F%E5%88%B0%E7%B2%BE%E5%87%86%EF%BC%89.pdf?sign=Mcs8qitL3BJM253wQ2oUJri1OZiCC9WXeDg1vBb-Uoc=:0" pwd=""]书籍下载[/c-downbtn]
许可协议:  CC BY 4.0