采集内容插入词库(词库我用私人订制方案，助你快速治疗懒癌！！ )

优采云发布时间: 2021-12-17 17:08

　　采集内容插入词库(词库我用私人订制方案，助你快速治疗懒癌！！

)

　　对于很多人来说，背单词是一种痛苦的经历，但学习英语也是必须的。痛点之一是，在使用托福、GRE等词汇记忆时，会遇到很多已经知道的单词，或者是很难遇到的单词忘记背。这个文章专门针对这个问题，分享一个我用了很久的词库的私人定制方案，还可以治疗懒癌。

　　有道词典

　　有道词典屏幕选词更方便，词库和社区功能也更全面，所以平时用的比较多。每天遇到的生词，可以随时放入有道自己的词汇书，采集回忆。有道词汇书虽然提供了背单词的功能，但是很单一，没有艾宾浩斯遗忘曲线，不适合复习单词。

　　墨迹

　　说一下陌陌（加个链接，免得大家想太多）。陌陌是我用过的最值得推荐的词汇记忆应用之一。原因如下：

　　1. 根据艾宾浩斯遗忘曲线给你需要复习的单词；

　　2. 可以创建自己的同义词库（在网页中操作），不需要跟着托福、雅思、四八同义词库记住很多已经背熟的词或者你通常不会遇到的；

　　3. 天天签到，签到即“鹏”，给你一丝不苟的成就感；

　　4. 你需要每天签到！一是因为如果几天不登录，就会积累很多需要复习的单词。其次，自建词库的词数不是无限的。通过购买获得数量是否会伤害您的自尊？）；

　　5. 另外，每天至少要记住10个字才能签到；

　　6. 例句和助记词非常丰富，可以创建自己喜欢的助记方法；

　　7. 例句或助记词中的生词可直接加入记忆列表；

　　8. 应用内链接的五个在线词典；

　　9. 可以查看自己背过的单词的多项统计指标，以及对未来复习单词数的预测；

　　10. 暂时想到这些。

　　同义词私人订单

　　所以问题来了。一个是日常使用和生词采集的有道词典，另一个是自建词库中可以轻松记忆和复习的墨背词。如何快速有效地将有道词典词汇中收录的生词导入到自己创建的墨迹中？在墨水词汇中？

　　在这里，我绝对不会让你费时费力地一个一个复制！如果将有道词本导出，再放入墨墨词典，您会发现导出的词本包括序号、注音、词性标签、中文含义等，直接将这些全部复制到自建词典会带来很多麻烦（试试就知道了）。我的解决方案是这样的：

　　1. 将有道词典单词本中想要添加到内存中的单词导出为.txt文件；

　　2. 将.txt文件的编码改为utf-8（直接另存为，有选项）；

　　3. 使用文末附加的python程序提取需要记住的单词；

　　4. 程序将生成一个 .txt 文件。打开之后，你会发现里面只剩下英文单词了。将它们复制到你自建的陌陌词典中，并记下词典编号；

　　5. 当你用陌陌记单词时，通过词库编号链接到你的词库，你就可以开始学习你的私人定制词库了。

　　代码

　　这个程序完成了文本文件中的记录：

　　350，化身[ɪnkɑː'neɪʃ(ə)n]n。化身；神道成肉身；典型化身：化身|

　　道成肉身 | 道成肉身

　　进入这个条目：

　　化身

　　该程序是用python编写的。我不经常做文本处理。这个程序只是满足简单的基本需求，所以应该还有很多需要改进的地方（欢迎分享你更好的解决方案）。你只需要用你的有道词典导出的utf-8编码的记事本文件的路径和名称替换第19行的E:\voc.txt

<p># -*- coding: utf-8 -*-

"""

Created on Apr 28 2016

Extracting vocabulary from Youdao dictionary

The vocabulary text file should be code as utf-8

file_in: the exported vocabulary from Youdao

file_out: the file to save the English words. Default file name is

new_words_'time'.txt ('time' is the local date)

@author: sinit

"""

import codecs,time

file_in = r'E:\voc.txt'

outname = 'new_words'+'_'+time.strftime("%Y-%m-%d",time.localtime())+".txt"

file_out = r'E:\\'+outname

fs = codecs.open(file_in, 'r','utf-8')

vocabulary = fs.readlines()

fs.close()

word = []

word.append(vocabulary[0].split()[1])

def is_chinese(uchar):

#Judge if a unicode is Chinese

if (uchar >=u'/u4e00')&(uchar= 0x2e80 and x = 0xff00 and x = 0x4e00 and x = 0xf900 and x = 0x20000 and x = 0x2f800 and x

0

2021-12-17

采集内容插入词库

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

采集内容插入词库(词库我用私人订制方案，助你快速治疗懒癌！！ )

0 个评论

发起人

AI时代内容工厂

采集内容插入词库(词库我用私人订制方案，助你快速治疗懒癌！！ )

0 个评论

发起人

相关问题