Wednesday, April 18, 2007

好书读后:商业建模与数据挖掘

Business modelling and Data Mining

Dorian Pyle著


该书并不拘泥于具体算法和局限的应用实例,而是从世界观(人们怎样通过主观的知识体系认识世界,并受其局限)入手,开篇即阐述了“为什么”,“确定挖什么”,“怎么挖,怎么建模”。


我越读越感觉,这些都是非常重要的,对于一个想在企业(由多人的不同思维、知识,企业的思维、知识构成的系统里)里崭露头角,对企业进步有所贡献的人。这也是作者不惜花好几页来定义“事件”,“物件”,“感知”,“结构”,“数据”“系统”等的原因,重新梳理这些概念,对于建模,有着哲学和基础的指导意义。譬如作者定义“事件”即不可逆的对周围发生影响的一种变化,无论其是多么小的变化,并以月球背面石头脱落的例子让读者有了一个非常明确的认知和认同。


兹举一例如下:在讲述从模式到知识的认识过程中(1.3.2),举了一个例子,问“13的一半是什么?”,要求在思考答案时,注意自己的思维过程,尽量去感受认识使能(enabling paradigm (of personal unconsicious learning/knowledging system))是如何工作的,看看是否能找到其局限和不舒服(可以改进)的地方。


一开始读的时候没注意,我给了一个“正确”答案:6.5,至于过程,不就是小学生学会的标准除法吗,没什么太多可想的。


回头一看,“请给出你的答案或答案们(复数)” write out your answers or answers.心念一动,一半的标准是什么?我果然受到了自己的认识体系的蒙蔽(如同作者提到,切尔诺贝利的科学家们,拒绝相信从控制室亲眼看到的反应堆融化,因为这和他们非常确信的真理抵触,这就是灾难成型的原因)。13的左边一半是1,右边一半是3,上边一半是1)(写不出来),还有斜着一半的分法,以及写在纸上,烧成灰之后的一半灰。thirteen的一半还可以是tite.

经典论述摘要:建模者需要和其他人的世界观协调工作,并可能需要去改变这些观点.

A E F H I K L M N T 这列字母有什么规律?



A B E G H J K O T U 的下一个字母是什么?


看完该书(的前20页)你就会有答案,非常简单的答案

提示2:下一个字母是V, 需要一个一阶2维的思考(one order, two variables(or dimensions),不算复杂)

检验一下你是不是被自己的知识认知体系给限制住了


需要答案也可以留言哦,欢迎交流

1 Comments:

Blogger hunter said...

上面说bayes网络只对nominal类型的输入变量敏感,也就是说,不能很好的预测数值类型。。



谁能解释一下?是否是只适合类似决策树的输入变量?



可是我看c4.5好像可以自动处理数值变量阿

Already solved.

June 10, 2007 at 5:27 AM  

Post a Comment

<< Home