图书介绍
语料库的制作与日语研究PDF|Epub|txt|kindle电子书版本网盘下载
![语料库的制作与日语研究](https://www.shukui.net/cover/62/35103712.jpg)
- 于康著;张威主编 著
- 出版社: 杭州:浙江工商大学出版社
- ISBN:9787811407068
- 出版时间:2013
- 标注页数:181页
- 文件大小:40MB
- 文件页数:191页
- 主题词:日语-研究
PDF下载
下载说明
语料库的制作与日语研究PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 语言资源的利用与语料库建设1
1.1制作语料库的目的1
1.2现在可供使用的主要语料库2
1.3制作自己的语料库5
1.4语料库的多元化用途6
第2章 电脑配置、所需软件及软件的安装8
2.1电脑的配置8
2.2所需软件8
2.2.1 Java9
2.2.2 「秀丸」9
2.2.3「えだまめ」10
2.2.4「ひまわり」10
2.3软件的下载和安装10
2.3.1 Java的下载和安装11
2.3.2「秀丸」的下载和安装11
3.3.3「えだまめ」的下载和安装14
2.3.4「ひまわり」的下载和安装18
2.4小结22
第3章 收集与保存语料23
3.1收集语料时所需的设备和软件23
3.1.1扫描仪23
3.1.2 Adobe?Acrobat?9 Standard(或X,或Pro,或以上的版本)25
3.1.3 JUST PDF 2[作成·高度編集·データ变换]25
3.1.4 OCR软件25
3.1.5「秀丸」26
3.2建立保存语料用的文件夹26
3.3收集语料的具体操作方法29
3.3.1从网上直接下载和保存语料29
3.3.2从PDF文件中读取和保存语料46
3.3.3将纸版语料转换为电子语料的步骤47
3.4小结67
第4章 清理语料68
4.1手动删除无用的信息69
4.2使用「正规表現/规则命令句」删除注音假名(ルビ)71
4.3使用「正规表現/规则命令句」删除文中的各类不需要的符号76
4.3.1删除各种装饰性符号76
4.3.2删除多余的文字和符号信息81
4.3.3删除空格和空行83
4.4出错时的返工方法87
4.5小结91
第5章 制作语料库93
5.1使用「えだまめ」转换文件的格式93
5.2使用全文检索软件「ひまわり」制作语料库98
5.3设定检索条件与检索例句106
5.3.1「検索文字列」106
5.3.2「フイルタ」111
5.3.3「コーパス」114
5.3.4「検索才プション」116
5.3.5例句栏上方的10个栏目标题118
5.4在全文中观察、保存和使用例句119
5.4.1在全文中观察例句119
5.4.2保存例句121
5.4.3展开和使用例句124
5.5小结133
第6章 给例句加注标签与日语研究135
6.1制作标签的思路136
6.2标签的分类与所需软件136
6.2.1标签的分类136
6.2.2加注标签时所使用的软件137
6.3如何给日语例句加注标签137
6.3.1加注标签与日语「存在構文」的研究138
6.3.2加注标签138
6.3.3制作加注标签的语料库「日本語の存在構文コーパス」154
6.3.4检索和保存例句以及清除垃圾例句164
6.3.5对标签进行统计和分析171
6.4小结178
参考文献180
后记181