页面载入中...
首页 » 2009年07月

SuperMemo2006之生词标注法

在这之前,舍得要手工制作词库,用的最简便的方法是借助ClipMate这个剪贴板软件(这个软件的介绍,可参看《SuperMemo2006之中文词库制作》一文)。最疯狂的一次是查了近6000多个词,在Collins词典中,不停地复制,因为有ClipMate在,只要事后合并一下就可以了,根本不需要去一个个粘贴,节省了一大半的时间。后来在笑来先生的博客上看到他介绍的利用Word来标注的方法,觉得非常不错,特意向大家推荐一下。

以下内容转载自笑来先生的博客,文末有该文的原始链接。

 

MS word
2007有个很好的功能(不知道Google Docs and
Spreadsheets什么时候会有这种重要的小功能?):“选择格式相似的文本(S)”。这样的话,就可以在阅读一篇英文文章的时候,顺手把生词都标记出来,而后可以通过“选择格式相似的文本(S)”把那些已经做了记号的文本单独拷贝出来。

选择之后,按“Ctrl+C”:

而后,再找个地方“Ctrl+V”,就可以得到以下的列表

 

  • neonatal
  • burgeoning
  • endoscopic
  • snaking
  • gallbladders
  • jabbed
  • sales pitch
  • laparoscopic
  • lickety-split

 

其实可以为“选择格式相似的文本(S)”设置快捷键的。点击Word 2007左上角的圆按钮;点击“Word
选项(I)”按钮;在左边框中选择“自定义”;点击右面板左侧下部“键盘快捷方式:”边上的“自定义(T)…”按钮;然后就可以看到“自定义键盘”对话框:

在对话框左面的面板里选择“所有命令”,然后在右面的面板里找到“SelectSimilarFormatting”,选择。而后先用鼠标点一下右侧“请按新快捷键(N)”下面的输入框,然后按快捷键——在这里我按的是“Alt+S”(不分大小写)。然后按左下角“指定”按钮,然后关闭对话框就可以了。以后,只要在Word中把光标移动到相应的位置,然后按快捷键“Alt+S”,就相当于上面鼠标右键菜单的选择动作了。

用同样的的方式,可以为Word的内嵌词典设置快捷键。在“自定义键盘”对话框里,左面的面板里选择“所有命令”,然后在右面的面板里找到“Translate”,选中,然后定义快捷键。我用的是“Alt+X”。Word默认的另外一个相当于这个命令的快捷方式是“Alt+鼠标左键点击”。

Word内嵌的词典是“美国传统英语词典”(American Heritage
Dictionary)的第四版(不过感觉比“金山词霸”里面的例句更多一些),支持“中文–>英文”、“英文–>中文”双向查询。要命的是,不知道为什么从Word
2007开始,右侧边栏显示的词典内容,不能够“全部选择”,只能“逐条选择”拷贝了。

在阅读的过程中使用什么格式为文本做标记呢?“加重”和“倾斜”可能并不是好的选择,因为文本中原本就可能有一些这样格式的文字;加高亮底色也不是好的选择,不知道为什么Word的“选择格式相似的文本(S)”竟然不支持这种格式。我一般使用“双下划线”。就象上面的图示里能看到的那样。这次不用自定义,因为双下划线有Word默认设置好的快捷键“Ctrl+Shift+D”。

去掉所有记号的方法是,在某一个标记了“双下划线”的单词上点一下鼠标左键,然后,按刚刚设置好的快捷键“Alt+S”,而后再按“Ctrl+Shift+D”就可以了。

 

音标字体的安装

不可否认,现在虽然电脑虽然普及得很快,但电脑知识的普及速度仍远远跟不上。虽然身边高手不少,但“菜鸟”明显更多。这里舍得没有侮辱菜鸟的任何意思。只是希望在舍得的帮助下,各位菜鸟兄弟能够尽快地把自己武装起来,这样才能有更多的精力投入到学习和工作中。

音标字体的安装问题,原来舍得以为是不用讲的,但没想到的是,这个问题居然也难倒了一部分人。没关系,舍得就专门讲一讲这个问题。

在安装完舍得汉化版后(定制安装中需要勾选“音标字体”这一项),在supermemo的安装文件夹下(通常是c:\program
files\supermemo2006),有一个叫“phonetic”的文件夹,里面放的就是大家要用到的音标文件。其中“_sm_ipa.ttf”是supermemo自带的字体,如果你要使用它的音标功能的话,就要用到这个文件。但舍得给大家准备的音标字体是在它下边的“other
fonts”文件夹里,比如金山的音标字体Ksphonet.TTF,新东方用到的音标字体TOPhonetic.ttf等,一般这两个比较常用一点。

安装的过程其实很简单,大家一步一步照着即可。先打开控制面板,双击字体图标。然后打开菜单“文件->安装新字体”,这时会出来一个对话框,在“驱动器”下拉列表框中选C盘,然后在“文件夹”中找“c:\program
files\supermemo2006\phonetic\other
fonts”(如果未安装在默认路径的,请根据自己的安装路径选择)。这时可能要稍等几秒,系统会读出该文件夹下的字体文件,选中你想安装的字体文件,比如Ksphonet.TTF,点“确定”即可开始安装。

安装完后,进入SuperMemo2006即可正常显示音标了。

至于如何选择正确的音标字体,舍得再教你一个诀窍,打开词库导入文件,比如说“朗文常用词3000.txt”,然后找到音标所在行的字体定义语句,如“<font
face=”Kingsoft Phonetic
Plain”>E5bAndEn</font>”,其中Kingsoft
Phonetic Plain就表示金山字体,安装Ksphonet.TTF即可。

用Excel制作SuperMemo的词库(续)

上文我们说到如何用Excel来制作SuperMemo的词库,虽然能够解决一些问题,但是,词库格式一复杂的话,还是让人有点望词兴叹。现在,就让舍得来晒一晒上文中所用到的Excel中的宏,顺便一起来研究一下如何在这个宏的基础上增加一些自己的小设计:

首先我们打开上文中的SuperMemo词库转换工具,如果你没有下载的话,可以点击这里下载:BrsBox下载

这回舍得换了台电脑,用的是Excel2003,大家莫见怪啊。点击菜单“工具->宏->宏”,或按快捷键“Alt+F8”,就可以看到原先建好的两个宏:Sheet1.生成QA1,Sheet2.生成QA2。

 

选择“Sheet1.生成QA1”,然后点击右边的“编辑”按钮,我们来看一下这个宏的内容:

Public Sub 生成QA1()
Dim i, n As Integer
Dim temp As String
i = [a65536].End(xlUp).Row ‘判断行数

‘生成文本文件
temp = ThisWorkbook.Path & “\QA词库1.txt”

Set fs =
CreateObject(“Scripting.FileSystemObject”)
Set a = fs.CreateTextFile(temp, True)

For n = 1 To i
a.WriteLine (“Q: ” & Cells(n, 1))
a.WriteLine (“A: ” & Cells(n, 2))
a.WriteLine
Next
a.Close

MsgBox
“词库成功生成!注意生成的文本文件还需转换成中欧ISO的字符集才可以使用!”


End Sub

熟悉编程语言的一看就能明白这个宏编写的思路,i是用来判断总行数的。问题的关键在于a.WriteLine,这是用来给行首加上“Q:”或“A:”的,假如你的词库格式是“英文、中文1、中文2”,象模板1那样排成3列,那你只要在“a.WriteLine
(“A: ” & Cells(n, 2))”下面加一行“a.WriteLine (“A: ”
& Cells(n, 3))”,就可以实现:

 

Q:(英文)

 

A:(中文1)

 

A:(中文2)

这样的效果。这里的“1、2、3”指的是列数。”a.WriteLine (“A: ” &
Cells(n, 2))”中的“Cells(n, 2)”就是第n行第2列的单元格的内容,依此类推。

 

再来看看Sheet2.生成QA2里的内容:

Public Sub
生成QA2()
Dim i, n As Integer
Dim temp As String
i = [a65536].End(xlUp).Row ‘判断行数

‘生成文本文件
temp = ThisWorkbook.Path & “\QA词库2.txt”

Set fs =
CreateObject(“Scripting.FileSystemObject”)
Set a = fs.CreateTextFile(temp, True)

For n = 1 To i
Step 2
a.WriteLine (“Q: ” & Cells(n, 1))
a.WriteLine (“A: ” & Cells(n + 1, 1))
a.WriteLine
Next
a.Close

MsgBox
“词库成功生成!注意生成的文本文件还需转换成中欧ISO的字符集才可以使用!”

End Sub

前面的基本上一样,不同之处在于定义n的时候多了个”step 2″,这里的”step
2″就表示执行完一个循环的指令后向下跳2行再执行下一遍指令。我们仍以上面那种格式的词库为例,不过由3列变成了3行,分别为第一行英文,第二行是中文1,第三行是中文2。首先我们要将“step
2”改为“step 3”,然后在“a.WriteLine (“A: ” & Cells(n + 1,
1))”下加上一句“a.WriteLine (“A: ” & Cells(n + 2,
1))”,生成的结果和上例相同。

了解了其中的原理后,那就可以增加一点点变化了,比如说象这样的词库:

money
n.货币, 钱, 金钱
5mQni
new
adj.新的, 初见的, 更新的
nju:
together
adv.共同, 一起, 合起来, 集拢地
tE5^eTE
work
n.工作, 劳动, 操作, 职业, [物]功, 手工, 作品, 机件
wE:k

我们要把第三行的音标放在第一行后面,并加上音标字体的定义和中括号,那你可以将模板二做这样的修改:

For n = 1 To i
Step 3
a.WriteLine (“Q: ”
& Cells(n, 1)
& ”
[<font face=’Kingsoft Phonetic
Plain’>” & Cells(n + 2, 1)
&
“</FONT>]”)
a.WriteLine
(“A: ” & Cells(n + 1, 1))
a.WriteLine
Next
a.Close

注意本例中用到的是金山的音标字体,若词库用到的别的字体的,应将字体名称进行修改,切勿生搬硬套。

其实细分解一下,在a.WriteLine中,只不过是用“&”来把你要写入的内容拼凑起来而已,究竟怎么玩就看大家的自由发挥了。

至于ThisWorkbook则是用来定义两个宏的按钮的,可以带来一点点方便。如果你定义了其它的宏,倒是可以用来给每个宏增加一个按钮,具体的定义方式只要“依样画葫芦”即可。

 

用Excel制作SuperMemo的词库

最近经常有网友在说制作词库如何如何的麻烦,尤其是喜欢自己收集词汇,制作自己的“专属”词库的朋友,按以前的思路,制作这样的词库要么是利用正则表达式进行批量处理,要么是手工一个一个敲到SuperMemo里,反正都是挺费劲的。尤其是使用后一种方法的朋友,由于SuperMemo的模板不那么容易听使唤,折腾起来更加让人郁闷。

大概在五月份的时候,一个叫徒然客的网友给舍得发过一个利用Excel的“宏”来进行批量处理的小工具,构思很不错,舍得测试之后,发现使用起来确实很方便。但当时舍得没太在意,结果就将它搁置起来了。巧合的是,大约在一个多月前,几个网友在舍得的博客上讨论用Excel来制作词库的方法,虽然舍得没有去亲身体验,但感觉跟徒然客的做法应该是一样的。现在就让舍得来介绍一下徒然客制作的这个小工具,给喜欢制作词库的朋友增加一个好用的工具。

文件已经上传到BiBiDu和BrsBox,下面是下载的链接:BrsBox下载

下载下来之后是一个excel的表格,如下图:


打开它,这里舍得用的是Excel2007版:


 

大家注意看下方一共有3个工作表,分别是“模板1”、“模板2”和“范例”,模板1的格式是左边英文(即A列)、右边中文(B列),模板2的格式则是一行英文、一行中文,范例则可以无视。

所以也就是说,要用这个工具制作出合适的词库,你得先把词库转成上述两种格式。这种方式对自己慢慢收集整理词库的朋友特别合适。

接下来舍得向大家介绍一下怎么用,喜欢自己琢磨的朋友可以直接跳过本文直接去研究这个表格了,对自己的电脑技术没有信心的则请继续往下阅读。

你可以按照模板1和模板2的格式往里添加内容,添加好后就象上图一样。

先检查一下宏有没有被禁用,如果Excel的窗口中出现了下图的内容,说明你的宏已被禁用,需要打开它:

 

点击上图中的“选项”按钮:

 

 

 

在弹出的对话框中勾选“启用此内容”,然后点击“确定”继续。

 

 

 

点击工具栏中的“加载项”,你可以看到有两个按钮,分别为“模板1”和“模板2”,如果你是按照“模板1”格式制作的,就选“模板1”按钮,反之则选“模板2”:

 

 

 

 

这时会弹出这样的对话框,提醒你做完这一步后,务必再进行一次转码的工作(转码请使用Emeditor这个工具):

 

 

 

 

检查“SuperMome词库转换工具.xls”所在的文件夹,发现多了一个叫“QA词库1.txt”的文件:

 

 

 

 

建议用Emeditor打开这个文件,如下图所示:

 

 

 

 

可以看到程序已经自动在行首加上了Q和A,其实就是很简单的一个功能。

这时再用Emeditor来进行转码,这个步骤千万不可忽视:

1.然后打开Emeditor的“工具->所有设置的属性”菜单,转到“文件”选项卡:

 

 



 

·

点击“正在保存”按钮,在弹出的“保存详细信息”对话框中勾选第二项:“保存Unicode为Html/Xml引用”,然后点击确定,关掉“所有设置属性”对话框,返回到Emeditor。(注:如果第一项也勾选的话,就会在下一步中出现是否“继续按当前编码保存”的对话框

 

 

 

2.打开“文件->另存为”菜单,弹出如下对话框后选定保存位置,输入文件名。然后在编码后的下拉列表框中选择“中欧ISO(28592,ISO-8859-2)”,点击“保存”按钮:

 

 

 

·

弹出对话框,保持默认的“继续按当前编码保存”不变,点击“确定”按钮继续。(注:如果在第6步“保存详细信息”对话框中未勾选第一项的话,那么这一步不会出现)

 

 

最后转好的效果如下:

 

 

 

点击图片或使用键盘← →翻页 

 

 

 

 

最好另起一个文件名保存,以免下次制作时被覆盖。

到这里词库就制作完了,在SuperMemo中新建一个词库,将它导入进去即可。对导入方法不明白的朋友可以参看舍得写的《SuperMemo之词库导入篇》。

从上面舍得的讲解中相信大家都能感觉得到,这只是一个非常简单的词库制作,有兴趣的朋友可以对这个文件中用到的宏进行改进,以便用在更多的场合中。

希望这篇短文能够给你带来一点点帮助。

近期的安排

这里的安排,讲的是舍得近期对博客的规划。

前段时间,由于舍得在外出差(现在还在外地),没带电脑,就算想发点文章,但手头缺乏工具,切切实实体会到了“巧妇难为无米之炊”的窘境。尤其是像Tell
Me More这样的大块头,要想写这方面的技术文章的话,必须装一个软件吧?Tell Me
More的汉化也是,且不去说舍得现在有没有这方面的时间,光是工具的准备就是个问题。Friends的句库也是如此,其实一个关键的工具“Q99复读机”是没法带到秦皇岛的,除非重新向作者购买一份(舍得主要用它来进行音频编辑)。

上个周末,舍得回了一趟北京,顺手将一些常用的软件带上了。所以接下来的一段时间,可以稍微做点东西出来。

舍得首先要做的是,制作一个绿色版的集成大量词库的SuperMemo。之前的词库发布都是文本格式的,需要使用者自己导入,这给大多数电脑菜鸟带来了很大的麻烦。舍得计划在这个版本中,将市面上流行的词库都做进去,同时将100多M的那个语音库也放在一起发布。这样做的好处是,拥有这个版本的朋友不大需要自己动手去做词库了。但潜在的问题也是比较严重的,那就是众口难调,每个人所需的词库都不太相同。不过好在这部分人大抵是动手精神比较强的,估计自己做个词库没什么太大的问题。

接下来是计划要发布的几篇文章:

1.excel格式的词库制作。这几天舍得在想,如果用excel方式来处理词库的话,词库制作的难度会或多或少降低一些,而且这种试更有利于那些喜欢用手工来添加词库的朋友;

2.写个音标字体安装帮助文件,老鸟们可以无视。但舍得发现,看舍得博客的“fans”中,还是有为数不少的“电脑菜鸟”的。

3.写一篇如何利用word来标记生词的方法——这个在李笑来先生的博客中有介绍。心急的朋友可以先去他的博客上看。但舍得会想法写出些不同来。

4.利用access来“提取”词汇。这么说大家可能没什么概念。这个功能到底怎么用呢?舍得举个最简单的例子:说白了就是象金山单词本一样,你只要提供单词,就能提取出相应的释义来。但用法上和金山单词本上有所区别——你可以自己编个超大的数据库,比如将朗文当代的英英版放到里面去,然后输入一个单词表,将它的例句、释义提取出来。关键在于你这个数据库编得质量如何。这篇文章舍得早就想写,但因为涉及到的软件比较多,操作相对比较复杂,一直没有动笔。

先说这么多吧。舍得会尽自己最大的努力,加快速度把上述的工作做完,请大家期待吧。

重复的力量

这是舍得身边发生的一件小事。

这段时间舍得在秦皇岛,每天拜访客户。记得在近十天的时间里,舍得拜访了一家单位前后有六、七次之多,一直没能见到单位的领导。司机老秦是从部队复员的老兵,比舍得小三岁。他很好玩,从来不去记领导的姓名。每次在单位门口遇到门卫询问的时候,他总会扭过头来问舍得,“找哪位?”舍得总是很耐心地边笑边告诉他,找“张院”。这样差不多折腾到第八次的时候,终于碰到了这位“张院”。

第九次去找张院的时候,在单位门口,舍得有意考一考老秦,就问他了,“我们找哪位呢?”没想到老秦很快地回答出来了,“找张院”。哈哈,终于被他记住了。

老秦的文化程度并不高,你想想在部队里他就呆了12年,肯定不会是大学毕业后去的吧?但这样反而能从他身上体现出记忆规律的威力。“张院”就好比是一个英语单词,第一次、第二次、第三次……可能他真的不记得,但后来的重复会慢慢地有点印象,加上平时对话中谈到的这个名字,印象无形中又加深了几分。就这样一次一次的重复,他就把“张院”这个词给记了下来。舍得估计他在记住这个名字是不大可能用得上什么记忆技巧的,但他无意中用了记忆的最基本的原理,那就是不断地重复能加深记忆。

所以说背英语单词其实也没这么难。最笨的方法就是,重复重复再重复。你只要不断地重复去背一个单词——但别误会,这个重复还是有一点点讲究的,那就是,你需要科学地安排重复的次数和时机。怎样才算科学呢?请看艾宾浩斯遗忘曲线。

现在我们有了SuperMemo这个工具,那这个艾宾浩斯遗忘曲线也不需要我们去关注了。你只要按照SuperMemo的学习计划去操练,它自然就运用艾宾浩斯的曲线去运行,什么时候再次背诵某个特定的单词,都会合理地给你安排出来,一切都是那么简单。照着SuperMemo的计划去学习,就会象老秦一样,不知不觉中就记住了要找的是“张院”,而不是李院王院孙院。这就是重复的力量了。