藏语计算语言学
题 目:藏语计算语言学 |
内容提要:
《藏语计算语言学》是国内第一本全面系统地介绍藏语计算语言学的著书,由浅入深地讲解了藏语计算语言学的基本理论和知识框架。全书在汉语、英语等自然语言计算机处理的相关基本知识和方法的基础上,结合藏语特点,介绍了基于规则的藏语自然语言分析方法,也介绍了基于统计的分析方法。全书共分四个部分,分别为藏文及藏文信息处理的基础知识、藏文词法分析、藏文句法分析和藏文语义分析。第一部分介绍了计算语言学的基本理论知识、藏文及藏文信息处理的基本知识;第二部分针对藏文信息处理中特有的分词问题,介绍了藏文自动分词及分词规范、分词中歧义的消解、未登录词识别、藏文词性标注及标注标准,以及藏文语料库的相关知识;第三部分从藏语语法的表示入手,将藏语自然语言处理形式化,再给出藏语语法分析的算法;第四部分介绍了藏语语义的表示及分析算法。
目录
第1章计算语言学概论
1.1计算语言学的定义
1.2计算语言学的发展历程
1.3计算语言学的研究范畴
1.4计算语言学的研究方法
1.5计算语言学与藏语研究
1.6计算语言学的发展趋势
第2章计算语言学基础知识
2.1概率统计基础
2.1.1事件和概率
2.1.2随机变量与分布函数
2.1.3随机变量的数字特征
2.1.4最大似然估计
2.2信息论基础
2.2.1信息的最优编码设计
2.2.2信息熵
2.2.3噪声信道模型
2.3隐马尔可夫模型
2.3.1马尔可夫过程
2.3.2隐马尔可夫过程
2.3.3向前算法和向后算法
2.3.4韦特比(Viterbi)算法
2.3.5Baum—Welch算法
第3章形式语法与自动机理论
3.1形式语法
3.1.1形式定义
3.1.2形式语法分类
3.2自动机理论
3.2.1自动机概述
3.2.2自动机术语
3.2.3形式描述
3.2.4有限自动机的分类
3.2.5有限自动机的扩展
第4章藏文信息处理
4.1藏文概述
4.2藏文字的构件
4.3藏文的拼与写
4.3.1藏文拼音规则
4.3.2藏文虚词形态规则
4.3.3藏文字体
4.4藏文编码与标准
4.4.1编码标准
4.4.2键盘及字库标准
第5章藏文自动分词
5.1藏文自动分词概述
5.1.1藏文自动分词的意义和作用
5.1.2藏文文本的切分特点
5.1.3藏文自动分词的难点
5.2藏文分词规范
5.2.1制定藏文分词规范的目标
5.2.2藏文分词规范简介
5.3藏文分词词典
5.3.1藏文分词词典的机制
5.3.2基于词属性的藏文分词词典
5.4藏文分词方法
5.4.1基于规则的分词方法
5.4.2基于统计的分词方法
5.4.3基于规则和统计的方法利弊
5.4.4专家系统分词法
5.4.5基于神经网络的分词方法
5.5藏文分词歧义理论
5.5.1藏文分词歧义的类型
5.5.2歧义消解的方法
5.6藏文未登录词
5.6.1藏文未登录词分类
5.6.2藏文未登录词的识别方法
第6章藏文词类自动标注
6.1藏文词类划分的意义
6.2藏文词类划分的理论依据
6.3藏文词类体系
6.4藏文词类及标记集规范
6.4.1适用范围
6.4.2词类及标记集规范确定原则
6.5藏文词性自动标注
6.5.1词性标注
6.5.2难点分析
6.6词性标注方法
6.6.1基于规则的方法
6.6.2基于统计的方法
6.6.3规则与统计相结合的方法
6.7HMM在藏文词性标注中的应用
6.7.1先验概率和条件概率
6.7.2HMM的三个基本问题
6.7.3Viterbi算法
6.7.4HMM与词性标注的关系
第7章藏文语料库与词汇知识库
7.1语料库的定义
7.2语料库的作用
7.2.1对藏语语言研究的作用
7.2.2对藏语自然语言处理的作用
7.2.3多学科综合研究
7.3语料库的发展简史
7.3.1第一代(20世纪70—80年代)
7.3.2第二代(20世纪80—90年代)
7.3.3第三代(20世纪90年代至今)
7.4国内语料库建设概况
7.5语料库的分类
7.6藏文语料库的设计
7.7藏文语料库构建原则
7.8藏文语料库的应用
7.9藏文语料库的标记及其规范
7.10藏文语料库的标记框架
7.10.1藏文语料库中文本属性的标记
7.10.2藏语文本结构信息的标记
7.10.3段落标记
7.10.4句子标记
7.10.5词汇标记
7.11藏文语料库框架标记范例
7.12词汇知识库
7.12.1FrameNet
7.12.2WordNet
7.12.3GKB
7.12.4HowNet
第8章藏语句法知识的表示
8.1基于短语结构的藏语句法形式化
8.1.1短语结构语法概述
8.1.2短语结构语法构成要素
8.2基于范畴语法的藏语句法形式化
8.2.1范畴语法概述
8.2.2范畴语法的基本思想和规则
8.2.3范畴语法与藏语句法形式化
8.3基于词汇功能的藏语句法形式化
8.3.1词汇功能语法概述
8.3.2词汇功能语法理论框架
8.3.3LFG两种语法层次结构
8.4基于功能合一的藏语句法形式化
8.4.1复杂特征集的定义
8.4.2藏语词汇的定义描述
8.4.3藏语句法规则的描述
8.4.4藏语语义规则的描述
8.4.5藏语句子合一运算的描述
8.5基于依存的藏语句法形式化
8.5.1依存语法概述
8.5.2依存语法理论
8.5.3依存语法的定义
8.5.4依存结构图
……
第9章藏语句法分析
第10章藏语语义知识的表示
第11章藏语语义分析
第12章藏语歧义消解
附录
参考文献
- 建设美丽社区营造宜居环境 社区居民笑容是甜的
- 2018中国九寨沟第十三届国际冰瀑旅游节开幕
- 天津自贸试验区平行进口汽车试点延伸至华南
- 宣讲达人王辅成:永远牢记身上这份党员责任
- 首轮中央环保督察问责超1.8万人 明年或"回头看"
- 天津环境保护突出问题边督边改第二百零三批公开信息
- 中央环保督察期间群众都举报了哪些问题? 官方回应
- 10名一线职工获"国企楷模·北京榜样"十大人物称号
- 对涉罪未成年人教育为主是放纵犯罪?最高检回应
- 城市空间改造百姓说了算 东城老锅炉房变社区综合服务楼
- 中央环保督察发现多个共性问题:与地方不作为有关
- 如何避免督察后地方放松整改?国家环保督察办回应
- 地方探索对侵害未成年人罪犯信息公开 最高检回应
- 今起京津冀实施外国人144小时过境免签政策
- 督察问责雷声大、雨点小?国家环保督察办回应