從局部的角度來看數(shù)據(jù)挖掘,到目前為止,主要的目的是模式發(fā)現(xiàn)。這和我們常聽到的模式識別頗有不同。用雷達(dá)找飛機(jī)的工作,算是后者──我們知道飛機(jī)是我們要找的對象。但是在數(shù)據(jù)挖掘中,我們在通常情況下并不知道我們要找的東西是什么。在技術(shù)上,這也不能通過抽樣的方法來做。模式是數(shù)據(jù)的局部結(jié)構(gòu),在這一部分,數(shù)據(jù)挖掘強(qiáng)調(diào)的方法是算法。數(shù)據(jù)一多,光憑人力是不能完全解決問題的,我們只有靠明確的指令讓計算機(jī)一個一個幫我們找。那么在這里,我們就完全用不上統(tǒng)計方法嗎?也不盡然。在提取訓(xùn)練樣本(training sample)的時候,我們是可以把實驗設(shè)計的想法放進(jìn)去的。
中國計算機(jī)用戶-賽迪網(wǎng)