愚墨的博客
  • 首页
  • 前端技术
  • 面试
只争朝夕不负韶华
前端技术

中文NLP

这个疫情整的,胖了好几斤~ 因为最近业务非常繁忙,系统迭代的非常快,手中需求已经排到2个月后了,所以NLP相关知识产出缓慢,浩姐又不让我占用工作时间,我&%¥#%%……& 上次文章简单总结了一下NLP相关的知识。具体到实际的中文NLP还是有些不同的。写篇文章总结一波。 中文NLP语料预处理的四个步骤 中文分词 – Chinese Word Segmentation 三大难点 没有统计的标准 歧义如何切分 新词如何识别 三种典型的分词方式 常见的分词器都是使用机器学习算法和词典相结合,一方面能够提高分…

2020年04月01日 0条评论 1680点热度 0人点赞 阅读全文
搜搜看看
历史遗迹
  • 2022年9月
  • 2022年3月
  • 2022年2月
  • 2021年5月
  • 2021年4月
  • 2021年1月
  • 2020年12月
  • 2020年11月
  • 2020年9月
  • 2020年7月
  • 2020年5月
  • 2020年4月
  • 2020年3月
  • 2020年1月
  • 2019年5月
  • 2019年3月
  • 2019年2月
  • 2019年1月
  • 2018年9月
  • 2018年3月
  • 2018年2月
  • 2018年1月
  • 2017年11月
  • 2017年7月
  • 2017年6月
  • 2017年3月
  • 2017年2月
  • 2017年1月
  • 2016年12月
  • 2016年11月
  • 2016年9月
  • 2016年8月
  • 2016年7月
  • 2016年6月
  • 2016年5月
  • 2016年4月
  • 2016年3月
  • 2016年2月
  • 2016年1月
  • 2015年12月
  • 2015年10月
  • 2015年9月
  • 2015年7月
  • 2015年6月
  • 2015年4月

COPYRIGHT © 2020 愚墨的博客. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS