① 语料库语言学的语料库的发展
语料语言学受行为主义的影响下,从60年代开始发展,迄今已经有近五十年的历史。
语料库在发展的初期,只进行词的一般分析,如词频统计等,后来增加了词的语法属性标注(如,词性等),直到现在,人们越来越开始重视对语料库作不同层次的标注,如:语音、构词、句法、语义以及语用等层次的标注。
语料语言学在其发展的初期并没有引起太大的共鸣,但是现代语料语言学已经得到越来越多人的承认,其应用也越来越广泛,从语言分析、语言教学、词典编撰到人工智能等领域都开始应用语料库。
语料语言学经历过这几十年的发展,不论在理论上,还是在技术上,都已趋于成熟。在语言教学领域中的应用也开始引起注意。我国对语料语言学研究取得了一定的成果,如:桂诗春教授主持的国家“九五”社科规划项目“中国英语学习者语料库”收集了从中学到大学的中国英语学习者的作文语料,共100多万词,并标注了学生在作文中常见的62类错误,错误类型包括了拼写错误、词语搭配错误、词语用法错误以及语法结构错误等,这对于指导中国学生学习英语起到积极的作用。在语言教学中,可以应用语料库来(1)分析学习者在语言学习过程中的常见错误;(2)确定语言学习项目的优先级;(3)自动生成各种类型的练习等。

② 语料库软件有哪些
火云译客里有全国最大的语料库,一共估计有5000万条左右,可以在翻译时使用。语料库一般是关于某些行业的术语,在翻译时使用能增加准确率
③ 语料库到底是什么,有什么,做什么的
语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为 "body of text"。
可以查询那些句子、用法合符规范
查不到结果的,避免使用
④ 请问一下,哪里可以免费下载到北大做的那个98年人民日报的语料库
上面的装什么B啊,还知识产权,就你知道,别人都是法盲?你用的操作系统、软件开发工具、办公软件都是正版的?一套VS就几千块,你自己买的起吗?还不是用破解版,你自己算算犯了多少法了?
⑤ 什么是语料库
语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为 "body of text"。
⑥ 如何建立自己的语料库
基本上没有办法建立相应的语料库,优质的原语料是优质语料库的前提。
动态变化的语料库:大众传播媒体的情况是在不断变化的,语料库也要相应变化.(例如:1978年,中国报纸只有186种,基本上是单一的党委机关报,到1995年底,已经增加到2202种,平均期印数增加4倍,总印张增加3·5倍,报纸的品种,功能,发行都有了相当大的变化如果要科学地反应语言的流通应用情况,语料库的容量,选材,抽样等怎么可能一成不变呢)。

(6)语料库的知识产权扩展阅读:
语料库的分类:
1、是研究双语语料的对齐技术(Alignment),国内外学者就此提出多种策略和方法,已经出现了许多对齐双语或多语语料的程序或工具[Gale 1993];
2、是研究双语语料的各种应用,如在基于统计的机器翻译技术[Brown 1990]、基于实例的机器翻译技术[Nagao 1984],双语词典编纂[Klavans and Tzoukermann 1990]技术中,双语语料库都发挥着十分重要的作用;
3、是双语语料库的设计、采集、编码和管理问题。比较著名的语料库编码方案有TEI 文本编码标准以及CES标准,两者均基于SGML标记语言研究
指不只有一种语言的语料库。分为平行语料库和对照语料库两种。平行语料库指库中的两种或多种文本互相是对方的译文,因此可以用于翻译或者机器翻译研究;对照语料库中两种或多种语言的文本不构成对译关系,只是领域相同,主题相近。通常只能用于两种或多种语言的对比。
⑦ 企业知识产权申报材料承诺书怎么写
知识产复权承诺书
本单位开发的知识制产权(商业秘密)明晰完整,归属或技术来源正当合法,未剽窃他人成果,未侵犯他人的知识产权或商业秘密。
若发生与上述承诺相违背的事实,由本单位承担全部法律责任。
法定代表人(签字):
单位(盖章):
年月 日
⑧ 什么是语料库
语料库中存放的是在语言的实际使用中真实出现过的语言材料。
⑨ 语料库的概述
名词(corpus,复数corpora)
指经科学取样和加工的大规模电子文本库。借助计算机分析工具,研究者可开展相关的语言理论及应用研究。
corpus
n. (pl. corpora)
refers to a large collection of well-sampled and processed electronic texts, on which language studies, theoretical or applied, can be concted with the aid of computer tools.
语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。 语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:⑴异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;⑵同质的(Homogeneous):只收集同一类内容的语料;⑶系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;⑷专用的(Specialized):只收集用于某一特定用途的语料。
除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库(Bible bilingual corpus)、Short messages service(SMS) corpus(短消息服务(SMS)语料)等。 语料库有三点特征
⒈语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;
⒉语料库是承载语言知识的基础资源,但并不等于语言知识;
⒊真实语料需要经过加工(分析和处理),才能成为有用的资源。
语料库的发展经历了前期(计算机发明以前),第一代语料库,第二代语料库,到第三代语料库

⑩ 请问语料库的使用方法,方向是NLP,刚刚入门而已,还不清楚如何使用语料库,以及从哪里能够获取语料库。
搭车同求啊。感觉很简单,但没一个规范,怕自己跑偏