Pythonword2vector(含安装环境)
⼀、安装Anaconda
因为镜像在国外,最好不要晚上下,⼀⼤早下⽐较好,如果是迅雷会员就⽆所谓了。
我下的是Anaconda3-5.0.,给⼀个百度⽹盘的链接
密码:6jm4
安装在D:\PythonSoftware\Anaconda3下⾯,⾃⼰建⽴⽂件夹,路径不能有空格,不能有中⽂。
安装时⼀定要勾选 “添加环境变量”这个项,会⾃动将Anaconda3所有的环境变量都加⼊
安装好后,在命令⾏输⼊ python
这样,python基本环境就安装好了,⾥⾯⾃带了很多包,可以直接使⽤,如果没有需要的包,可以在命令⾏中输⼊pip list
可以看到pip可以安装哪些包,⽤pip install 包名 ,就可以在线安装了。
⼆、安装pycharm
下载地址:
最后⼀步,把Run pycharm 勾起来,直接启动
下⾯的这个图会⾃动弹出,把快捷键修改为eclipse,其他OK
根据下⾯的博客修改提⽰的快捷键的操作:
三、安装码云插件
将刚才建⽴的项⽬托管到码云中
这样以后就可以直接push了
添加ignore⽂件:
乐谱转js教程
.gitignore
加⼊语句:
/data/*
四、安装 pyltp
pyltp是哈⼯⼤的NLP⼯具的python封装
cmd:
pip install pyltp
结果报错。
将解压后的ltp⽂件夹命名为ltp,整体复制到pyltp中。
也就是将ltp所有内容作为⼀个⽂件夹放到pyltp中。解压pyltp后所得到的⽂件夹中已经有⼀个名为ltp的空⽂件夹,把它替换或覆盖即可。 进⼊pyltp⽂件夹,cmd:
python setup.py install
还是报错。
选择⾃定义安装,把√都去了。LTP这东西得编译,不然⽤不起来。
然后
pip install --upgrade setuptools
pip install --upgrade pip
pip install pyltp
特斯拉事件升级了简直想说我 *********** 啊,还是报错!
安装cmake:
安装时勾选⾃动添加环境变量
flag的复数
下载basetsd.h,百度搜⼀下就有,百度⽂库⾥⾯
然后放到D:\PythonSoftware\Anaconda3\include下⾯,因为上⾯报错是没有这个⽂件
还是报错!放弃了!
五、安装gensim
下载 gensim-3.1.0-cp36-cp36m-win_amd64.whlpython入门教程网盘
pip install gensim-3.1.0-cp36-cp36m-win_amd64.whl
也可以在线安装:
直接在user⽬录中创建⼀个pip⽬录,如:C:\Users\xx\pip,新建⽂件pip.ini,内容如下
c语言指针表示方法
[global]
index-url = pypi.tuna.tsinghua.edu/simple
以上是修改镜像为清华⼤学,然后在线安装会发现下载速度贼快
pip install gensim
清除pip缓存路径:
%LocalAppData%\pip\Cache
六、安装结巴分词
pip install jieba
import jieba
import jieba.posseg as pseg
s = "我爱中国"
l = jieba._lcut(s)  # 分词,结果是list
print(l)
words = pseg.cut(s)  # 进⾏分词
电脑浏览器启用javascriptresult = []  # 记录最终结果的变量
for w in words:
result.append(str(w.word) + "/" + str(w.flag))  # 加词性标注
print(result)
七、word2vector
词向量训练是已经分好词的句⼦,去除标点符号,由于语料库已经分词且词性标注了,所以不需要分词了, 不然就⽤结巴分词⼀下。 语料库是GB2312编码的,先⽤emeditor转成utf8的。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。