從局部的角度來(lái)看數(shù)據(jù)挖掘,到目前為止,主要的目的是模式發(fā)現(xiàn)。這和我們常聽(tīng)到的模式識(shí)別頗有不同。用雷達(dá)找飛機(jī)的工作,算是后者──我們知道飛機(jī)是我們要找的對(duì)象。但是在數(shù)據(jù)挖掘中,我們?cè)谕ǔG闆r下并不知道我們要找的東西是什么。在技術(shù)上,這也不能通過(guò)抽樣的方法來(lái)做。模式是數(shù)據(jù)的局部結(jié)構(gòu),在這一部分,數(shù)據(jù)挖掘強(qiáng)調(diào)的方法是算法。數(shù)據(jù)一多,光憑人力是不能完全解決問(wèn)題的,我們只有靠明確的指令讓計(jì)算機(jī)一個(gè)一個(gè)幫我們找。那么在這里,我們就完全用不上統(tǒng)計(jì)方法嗎?也不盡然。在提取訓(xùn)練樣本(training sample)的時(shí)候,我們是可以把實(shí)驗(yàn)設(shè)計(jì)的想法放進(jìn)去的。
中國(guó)計(jì)算機(jī)用戶-賽迪網(wǎng)