README
最后更新于
这有帮助吗?
最后更新于
这有帮助吗?
《自然语言处理综论》第三版翻译。原文:。
若无特别说明,文中括号或者引用块中的 斜体字 为对应的英文原文或者我自己注释的话(会标明 译者注),引用块开头若标明「译者注」,则整个引用块都是我自己注释的话。否则为原文中本来就有的话。
本翻译系列目前可以在以下平台在线阅读:
【推荐】知乎。链接:。注意不是实时发布,会在翻译完整节之后同步到知乎。对脚注和数学公式等格式支持较好。
GitBook。链接:。与 GitHub 保持实时更新。不支持渲染脚注,但不会被吃掉。由于行内公式使用的是 $$
,所以行内公式无法正常显示。
GitHub。链接:。内容最新。不支持脚注,但不会被吃掉。数学公式完全不支持。
第二章 正则表达式,文本规范化,编辑距离
2.1.1 基础正则表达式模式
2.1.2 逻辑或,组合和优先级
2.1.3 一个简单的例子
2.1.4 更多的运算符
2.1.5 一个更复杂的例子
2.1.6 替换,捕获组(Capture Groups)和 ELIZA
2.1.7 先行断言
2.4.1 用于粗略分词和规范化的 Unix 工具
2.4.2 分词
2.4.3 用于分词的字节对编码
2.4.4 词规范化,词形还原和词干提取
2.4.5 分句
2.5.1 最小编辑距离算法
第八章 用于词性和命名实体的序列标注
8.4.1 马克可夫链
8.4.2 隐马尔可夫模型
8.4.3 HMM 标注器组件
8.4.4 HMM 标注的解码部分
8.4.5 维特比算法
8.4.6 例子
8.5.1 CRF 词性标注器中的特征
8.5.2 用于命名实体识别的 CRF 特征
8.5.3 CRF 的推理和训练
8.7.1 双向性
8.7.2 基于规则的方法
8.7.3 形态丰富语言的词性标注
第十二章 成分文法
(进行中)
接下来计划要翻译的章节:
(27 页, 中提到)
(21 页, 中提到)
【进行中】(30 页)
(22 页, 中提到)