??? ?? ??? ????? ??? ???? ??????? ???? ???? ????? ??面向中文分词的大规模语料库自然标注信息研究饶高琦 修驰 荀恩东北京语言大学信息科学学院研究背景标点符号阿拉伯数字拉丁字母强独立性字互联网标记……自然标注信息:来自语料本身的标注信息人工标注信息:来自标注人员和专家区分:产生于语料采集前或后20224262研究意义1.语言知识形式化困难2.协同