数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。其应用非常广泛,哪里有大数据哪里就有数据挖掘。
其实只要我们有数据挖掘的思维,即使是小数据,同样可以挖掘出有意思的东西,大大提高我们的学习和工作效率。
在这里我很想和大家交流一下数据挖掘在学习意大利语远过去时态中的应用。
意大利语远过去时:通常表示比较遥远的过去发生的动作,也表示跟现在没有密切关系的过去发生的并应经完成的动作。远过去时态(Passato Remoto)的动词变位分为规则和不规则:
部分远过去时不规则的动词变位第一人称如下:
第一个外语单词是动词原形,第二个外语单词是这个动词的远过去时不规则的动词变位的第一人称形式。
(在这里我主要是和大家交流数据挖掘的思路,而不是教意大利语,所以就不再讨论其他人称形式。)
rimanere停留: rimasti
nascere出生: nacqui
vivere生活: vissi
cadere掉,落: caddi
correre跑: corsi
crescere生长: crebbi
dipendere依靠: dipesi
esplodere爆炸: esplosi
evadere逃离:evasi
giungere到达: giunsi
scendere: scesi
sorgere升起:sorsi
accorgersi发现:mi accorsi
dolersi抱怨:mi dolsi
valere价值:valsi
parere似乎: parvi
leggere: lessi
scrivere: scrissi
rompere打碎: ruppi
corrompere: corromppi
interrompere: interromppi
irrompere: irromppi
prorompere: proromppi
sapere: seppi
tenere: tenni
vedere: vidi
volere: volli
accendere点燃: accesi
accludere附上: acclusi
decidere: decisi
tacere沉默: tacqui
piacere: piacqui
mettere: misi
appendere挂: appesi
discutere讨论: discussi
cogliere采集: colsi
ardere点燃: arsi
assolvere释放: assolsi
assumere承担:assunsi
bere: bevvi
chiedere: chiesi
chiudere: chiusi
cingere(围): cinsi
stringere(握紧): strinsi
fingere(假装): finsi
vincere战胜: vinsi
volgere转向: volsi
conoscere: conobbi
perdere失去: persi
servire: servii
dire: dissi
venire: venni
这只是我们面临的部分数据(我们这次研究的全部数据和Bigdata相比是属于非常小的数据:10M都不到),但是要记住它们的话,记忆量很大而且很容易忘记。有没有什么办法挖掘出有用的信息呢?
记忆陌生的东西的好办法:通过熟悉的东西记忆。例如:一个叫李民的人做自我介绍:李世民的李,李世民的民。这样比他直接告诉别人他叫李民要好记的得多。
因此数据挖掘的思路有了:这些数据是否和已经熟知的东西有关联呢?
在意大利语法中还有现在时态,一般过去时态,现在完成时态等等是学习意大利语必须掌握的时态。
这个远过去时态会不会和已经熟悉的现在时态,一般过去时态(passato prossimo),现在完成时态等的动词变位有关联呢?
把这些数据导入挖掘工具,运用关联分析,我们发现:如果一个动词的一般过去时态(passato prossimo)是不规则的很可能它的远过去时态(Passato Remoto)也是不规则的。
再经过分析,发现两种不规则变化还很类似。
这个发现对于一个正在学习意大利远过去时态的学生来说是非常有用的!
他可以通过他熟知的这个动词的一般过去时态(passato prossimo)是否规则迅速判断它的远过去时态是否规则,并可以根据我们挖掘到下面的规则迅速得出这个动词的远过去时的第一人称是怎样的。
通过这种方式可以迅速建立学习的信心,并在练习中不断强化记忆,达到事半功倍的效果。
我们挖掘到的:
总结远过去时态(Passato Remoto)不规则常用动词变化规则如下:第一列为分类,第二列为动词原形,第三列为一般过去时态(passato prossimo),第四列为远过去时态(Passato Remoto)



第一类(tipo1): 有8个常用动词有这样的规则,如果动词的一般过去时态(passato prossimo)不规则变化而且是以 sso结尾 那么它的远过去时态(Passato Remoto)很可能也是不规则的而且它的第一人称以ssi结尾。
第二类(tipo2): 有10个常用动词有这样的规则,如果动词的一般过去时态(passato prossimo)不规则变化而且是以 tto结尾 那么它的远过去时态(Passato Remoto)很可能也是不规则的而且它的第一人称以ssi结尾。
第三类(tipo3): 有19个常用动词有这样的规则,如果动词的一般过去时态(passato prossimo)不规则变化而且是以 so结尾 那么它的远过去时态(Passato Remoto)很可能也是不规则的而且它的第一人称以si结尾。
第四类(tipo4): 有21个常用动词有这样的规则,如果动词的一般过去时态(passato prossimo)不规则变化而且是以 to结尾 那么它的远过去时态(Passato Remoto)很可能也是不规则的而且它的第一人称以si结尾。
第五类(tipo5): 有3个常用动词有这样的规则,如果动词的一般过去时态(passato prossimo)不规则变化而且是
实际上以上五类属于同一大类
第六类(tipo6)和第七类(tipo7)和上面这五不一样,但是只有13个常用动词属于第六类第七类
因此:对业务的熟悉程度,对数据的敏锐度是非常重要的。如果只知道挖掘工具的使用而不知道如何挖掘,就好像一个对photoshop使用熟练但是对美术一窍不通的人,是很难用photoshop进行原创设计的。


雷达卡


京公网安备 11010802022788号







