diff --git a/.gitignore b/.gitignore
index 0de90e72..6564ff4a 100644
--- a/.gitignore
+++ b/.gitignore
@@ -88,5 +88,3 @@ ENV/
 # Rope project settings
 .ropeproject
 .vscode
-
-
diff --git a/README.md b/README.md
index 4aec5c83..83034041 100644
--- a/README.md
+++ b/README.md
@@ -11,9 +11,11 @@
 * 3) å†³ç­–æ ‘
     * [å†³ç­–æ ‘](./docs/3.å†³ç­–æ ‘.md)
 * 4) åŸºäºŽæ¦‚çŽ‡è®ºçš„åˆ†ç±»æ–¹æ³•ï¼šæœ´ç´ è´å¶æ–¯
+    * [æœ´ç´ è´å¶æ–¯](./docs/4.æœ´ç´ è´å¶æ–¯.md)
 * 5) Logisticå›žå½’
     * [Logisticå›žå½’](./docs/5.Logisticå›žå½’.md)
 * 6) æ”¯æŒå‘é‡æœº
+    * [æ”¯æŒå‘é‡æœº](./docs/6.æ”¯æŒå‘é‡æœº.md)
 * 7) åˆ©ç”¨AdaBoostå…ƒç®—æ³•æé«˜åˆ†ç±»
 
 ## ç¬¬äºŒéƒ¨åˆ†  åˆ©ç”¨å›žå½’é¢„æµ‹æ•°å€¼åž‹æ•°æ®
diff --git a/docs/10.k-meansèšç±».md b/docs/10.k-meansèšç±».md
new file mode 100644
index 00000000..33d0a0f1
--- /dev/null
+++ b/docs/10.k-meansèšç±».md
@@ -0,0 +1,21 @@
+
+# 10) k-meansèšç±»
+* èšç±»ä»‹ç»
+    * èšç±»æ˜¯ä¸€ç§æ— ç›‘ç£çš„å­¦ä¹ ï¼Œå®ƒå°†ç›¸ä¼¼çš„å¯¹è±¡å½’åˆ°ä¸€ä¸ªç°‡ä¸­ã€‚
+    * èšç±»åˆ†æžè¯•å›¾å°†ç›¸ä¼¼å¯¹è±¡å½’å…¥åŒä¸€ç°‡ï¼Œå°†ä¸ç›¸ä¼¼å¯¹è±¡å½’åˆ°ä¸åŒç°‡ã€‚ç›¸ä¼¼è¿™ä¸€æ¦‚å¿µå–å†³äºŽæ‰€é€‰æ‹©çš„ç›¸ä¼¼åº¦è®¡ç®—æ–¹æ³•ã€‚
+* K-å‡å€¼èšç±»ç®—æ³•
+    * ä¼˜ç‚¹ : å®¹æ˜“å®žçŽ°
+    * ç¼ºç‚¹ : å¯èƒ½æ”¶æ•›åˆ°å±€éƒ¨æœ€å°å€¼ï¼Œåœ¨å¤§è§„æ¨¡æ•°æ®é›†ä¸Šæ”¶æ•›è¾ƒæ…¢ã€‚
+    * ä½¿ç”¨æ•°æ®ç±»åž‹ : æ•°å€¼åž‹æ•°æ®ã€‚
+* K-å‡å€¼ç®—æ³•å·¥ä½œæµç¨‹
+    *  é¦–å…ˆï¼Œéšæœºç¡®å®š k ä¸ªåˆå§‹ç‚¹ä½œä¸ºè´¨å¿ƒã€‚
+    *  ç„¶åŽï¼Œå°†æ•°æ®é›†ä¸­çš„æ¯ä¸ªç‚¹åˆ†é…åˆ°ä¸€ä¸ªç°‡ä¸­ã€‚ï¼ˆä¸ºæ¯ä¸ªç‚¹æ‰¾åˆ°è·å…¶æœ€è¿‘çš„è´¨å¿ƒï¼Œå¹¶å°†å…¶åˆ†é…ç»™è¯¥è´¨å¿ƒæ‰€å¯¹åº”çš„ç°‡ï¼‰
+    *  æœ€åŽï¼Œæ¯ä¸ªç°‡çš„è´¨å¿ƒæ›´æ–°ä¸ºè¯¥ç°‡æ‰€æœ‰ç‚¹çš„å¹³å‡å€¼ã€‚
+* K-å‡å€¼ç®—æ³•ä¼ªä»£ç å¦‚ä¸‹
+    * åˆ›å»º k ä¸ªç‚¹ä½œä¸ºèµ·å§‹è´¨å¿ƒï¼ˆé€šå¸¸æ˜¯éšæœºé€‰æ‹©ï¼‰
+    * å½“ä»»æ„ä¸€ä¸ªç‚¹çš„ç°‡åˆ†é…ç»“æžœå‘ç”Ÿæ”¹å˜æ—¶
+        * å¯¹æ•°æ®é›†ä¸­çš„æ¯ä¸ªæ•°æ®ç‚¹
+            * å¯¹æ¯ä¸ªè´¨å¿ƒ
+                * è®¡ç®—è´¨å¿ƒä¸Žæ•°æ®ç‚¹ä¹‹é—´çš„è·ç¦»
+            * å°†æ•°æ®ç‚¹åˆ†é…åˆ°è·å…¶æœ€è¿‘çš„ç°‡
+        * å¯¹æ¯ä¸€ä¸ªç°‡ï¼Œè®¡ç®—ç°‡ä¸­æ‰€æœ‰ç‚¹çš„å‡å€¼å¹¶å°†å‡å€¼ä½œä¸ºè´¨å¿ƒ
diff --git a/docs/4.æœ´ç´ è´å¶æ–¯.md b/docs/4.æœ´ç´ è´å¶æ–¯.md
new file mode 100644
index 00000000..0c1f0f6e
--- /dev/null
+++ b/docs/4.æœ´ç´ è´å¶æ–¯.md
@@ -0,0 +1,50 @@
+   
+# 4) æœ´ç´ è´å¶æ–¯
+
+
+
+* å‡è®¾: ç‰¹å¾ä¹‹é—´å¼ºï¼ˆæœ´ç´ ï¼‰ç‹¬ç«‹
+* æ¦‚çŽ‡æ¨¡åž‹
+
+    * P(C|F1F2...Fn) = P(F1F2...Fn|C)P(C) / P(F1F2...Fn)
+
+   * ç”±äºŽå¯¹äºŽæ‰€æœ‰ç±»åˆ«ï¼ŒP(F1F2...Fn)éƒ½æ˜¯ç›¸åŒçš„ï¼Œæ¯”è¾ƒP(C|F1F2...Fn)åªç”¨æ¯”è¾ƒP(F1F2...Fn|C)P(C)å°±å¥½äº†
+
+* æœ´ç´ è´å¶æ–¯çš„ç‰¹ç‚¹
+
+    * ä¼˜ç‚¹ï¼šåœ¨æ•°æ®è¾ƒå°‘çš„æƒ…å†µä¸‹ä»ç„¶æœ‰æ•ˆï¼Œå¯ä»¥å¤„ç†å¤šç±»åˆ«é—®é¢˜
+
+    * ç¼ºç‚¹ï¼šå¯¹äºŽè¾“å…¥æ•°æ®çš„å‡†å¤‡æ–¹å¼è¾ƒä¸ºæ•æ„Ÿ
+
+    * é€‚ç”¨æ•°æ®ç±»åž‹ï¼šæ ‡ç§°åž‹æ•°æ®
+
+* æœ´ç´ è´å¶æ–¯çš„ä¸€èˆ¬è¿‡ç¨‹
+
+    * æ”¶é›†æ•°æ®ï¼šå¯ä»¥ä½¿ç”¨ä»»ä½•æ–¹æ³•
+
+    * å‡†å¤‡æ•°æ®ï¼šéœ€è¦æ•°å€¼åž‹æˆ–è€…å¸ƒå°”åž‹æ•°æ®
+
+    * åˆ†æžæ•°æ®ï¼šæœ‰å¤§é‡ç‰¹å¾æ—¶ï¼Œç»˜åˆ¶ç‰¹å¾ä½œç”¨ä¸å¤§ï¼Œæ­¤æ—¶ä½¿ç”¨ç›´æ–¹å›¾æ•ˆæžœæ›´å¥½ã€‚
+
+    * è®­ç»ƒç®—æ³•ï¼šè®¡ç®—ä¸åŒçš„ç‹¬ç«‹ç‰¹å¾çš„æ¡ä»¶æ¦‚çŽ‡
+
+    * æµ‹è¯•ç®—æ³•ï¼šè®¡ç®—é”™è¯¯çŽ‡
+
+    * ä½¿ç”¨ç®—æ³•ï¼šæ–‡æœ¬åˆ†ç±»ç­‰
+
+*  ä¼˜åŒ–
+
+    * ä¸ºäº†é¿å…ä¸€ä¸ªæ¦‚çŽ‡ä¸º0å¯¼è‡´P(F1|C)*P(F2|C)....P(Fn|C)æ•´ä¸ªä¸º0ï¼Œæ‰€ä»¥ä¼˜åŒ–ä¸ºå°†æ‰€æœ‰è¯çš„å‡ºçŽ°æ•°éƒ½åˆå§‹åŒ–ä¸º1ï¼Œå¹¶å°†åˆ†æ¯åˆå§‹åŒ–ä¸º2.
+
+    * ç”±äºŽå¤§éƒ¨åˆ†å› å­æ¯”è¾ƒå°ï¼Œä¹˜ç§¯ä¹‹åŽå¾—åˆ°çš„æ•°ä¸æ˜“æ¯”è¾ƒï¼Œç¨‹åºè¯¯å·®è¾ƒå¤§ã€‚æ‰€ä»¥å–å¯¹æ•°åŽå¯å°†ä¹˜æ³•è½¬åŒ–ä¸ºåŠ æ³•ï¼šP(F1|C)*P(F2|C)....P(Fn|C)P(C) -> log(P(F1|C))+log(P(F2|C))+....+log(P(Fn|C))+log(P(C))
+
+* æ€»ç»“
+
+    * è¿™ä¸€å—ä»£ç æ¯”è¾ƒä¹±ï¼Œæœ€å¥½å…ˆæŠŠå…¬å¼ç†ä¸€ç†å†çœ‹
+
+    * å¯ä»¥å‚è€ƒä¸€ä¸‹[é˜®ä¸€å³°çš„åšå®¢](http://www.ruanyifeng.com/blog/2013/12/naive_bayes_classifier.html)
+
+
+
+
+    
diff --git a/docs/6.æ”¯æŒå‘é‡æœº.md b/docs/6.æ”¯æŒå‘é‡æœº.md
new file mode 100644
index 00000000..021fa531
--- /dev/null
+++ b/docs/6.æ”¯æŒå‘é‡æœº.md
@@ -0,0 +1,25 @@
+
+# 6) æ”¯æŒå‘é‡æœº
+
+* åŸºæœ¬æ¦‚å¿µ
+
+    * å‡è®¾æœ‰ä¸¤ç»„æ•°æ®ï¼Œæˆ‘ä»¬å¯ä»¥ç”¨ä¸€æ¡çº¿å°†è¿™ä¸¤ä¸ªæ•°æ®é›†åˆ†éš”å¼€ï¼Œè¿™æ¡ç›´çº¿ç§°ä¸ºåˆ†éš”è¶…å¹³é¢
+    ï¼ˆå½“ç»´æ•°å¾ˆé«˜æ—¶ç§°ä¸ºåˆ†éš”è¶…å¹³é¢ï¼‰ã€‚
+    * æˆ‘ä»¬å¸Œæœ›æ‰¾åˆ°ç¦»åˆ†éš”è¶…å¹³é¢æœ€è¿‘çš„ç‚¹ï¼Œç¡®ä¿å®ƒä»¬ç¦»åˆ†éš”é¢çš„è·ç¦»å°½å¯èƒ½è¿œã€‚
+    * æ”¯æŒå‘é‡å°±æ˜¯ç¦»åˆ†éš”è¶…å¹³é¢æœ€è¿‘çš„é‚£äº›ç‚¹ã€‚
+
+* æ”¯æŒå‘é‡æœºç‰¹ç‚¹
+
+    * ä¼˜ç‚¹ï¼šæ³›åŒ–é”™è¯¯çŽ‡ä½Žï¼Œè®¡ç®—å¼€é”€ä¸å¤§ï¼Œç»“æžœæ˜“è§£é‡Šã€‚
+    * ç¼ºç‚¹ï¼šå¯¹å‚æ•°è°ƒèŠ‚å’Œæ ¸å‡½æ•°çš„é€‰æ‹©æ•æ„Ÿï¼ŒåŽŸå§‹åˆ†ç±»å™¨ä¸åŠ ä¿®æ”¹ä»…é€‚ç”¨äºŽå¤„ç†äºŒç±»é—®é¢˜ã€‚
+    * é€‚ç”¨æ•°æ®ç±»åž‹ï¼šæ•°å€¼åž‹å’Œæ ‡ç§°åž‹æ•°æ®ã€‚
+
+* SVMåº”ç”¨çš„ä¸€èˆ¬æµç¨‹
+    1. å‡†å¤‡æ”¶é›†æ•°æ®ï¼šå¯ä»¥ä½¿ç”¨ä»»ä½•æ–¹æ³•ã€‚
+    2. å‡†å¤‡æ•°æ®ï¼šéœ€è¦æ•°å€¼åž‹æ•°æ®ã€‚
+    3. åˆ†æžæ•°æ®ï¼šæœ‰åŠ©äºŽå¯è§†åŒ–åˆ†éš”è¶…å¹³é¢ã€‚
+    4. è®­ç»ƒç®—æ³•ï¼šSVMçš„å¤§éƒ¨åˆ†æ—¶é—´éƒ½èŠ±åœ¨è®­ç»ƒä¸Šï¼Œè¯¥è¿‡ç¨‹ä¸»è¦å®žçŽ°ä¸¤ä¸ªå‚æ•°çš„è°ƒä¼˜ã€‚
+    5. æµ‹è¯•ç®—æ³•ï¼šæµ‹è¯•åˆ†ç±»ç»“æžœæ˜¯å¦è¾¾åˆ°é¢„æœŸçš„ç›®çš„ã€‚
+    6. ä½¿ç”¨ç®—æ³•ï¼šå‡ ä¹Žæ‰€æœ‰åˆ†ç±»é—®é¢˜éƒ½å¯ä»¥ä½¿ç”¨SVMï¼Œå€¼å¾—ä¸€æçš„æ˜¯ï¼ŒSVMæœ¬èº«æ˜¯ä¸€ä¸ªäºŒç±»åˆ†ç±»å™¨ï¼Œ
+        å¯¹å¤šç±»é—®é¢˜åº”ç”¨SVMéœ€è¦å¯¹ä»£ç åšä¸€äº›ä¿®æ”¹ã€‚
+
diff --git a/docs/8.é¢„æµ‹æ•°å€¼åž‹æ•°æ®ï¼šå›žå½’.md b/docs/8.é¢„æµ‹æ•°å€¼åž‹æ•°æ®ï¼šå›žå½’.md
new file mode 100644
index 00000000..90b975ad
--- /dev/null
+++ b/docs/8.é¢„æµ‹æ•°å€¼åž‹æ•°æ®ï¼šå›žå½’.md
@@ -0,0 +1,18 @@
+
+# 8)Ô¤²âÊýÖµÐÍÊý¾Ý£º»Ø¹é
+
+* ÏßÐÔ»Ø¹éµÄÌØµã
+    * ÓÅµã£º½á¹ûÒ×ÓÚÀí½â£¬¼ÆËãÉÏ²»¸´ÔÓ¡£
+    * È±µã£º¶Ô·ÇÏßÐÔµÄÊý¾ÝÄâºÏ²»ºÃ¡£
+    * ÊÊÓÃÊý¾Ý·¶Î§£ºÊýÖµÐÍºÍ±ê³ÆÐÍÊý¾Ý¡£
+* ¹¤×÷Ô­Àí
+    * »Ø¹éµÄÄ¿µÄÊÇÔ¤²âÊýÖµÐÍµÄÄ¿±êÖµ¡£×îÖ±½ÓµÄ°ì·¨ÊÇÒÔ¼°ÊäÈëÐ´³öÒ»¸öÄ¿±êÖµµÄ¼ÆËã¹«Ê½¡£
+* »Ø¹éµÄÒ»°ãÁ÷³Ì
+    * ÊÕ¼¯Êý¾Ý£ºÈÎºÎ·½·¨
+    * ×¼±¸Êý¾Ý£º»Ø¹éÐèÒªÊýÖµÐÍÊý¾Ý£¬±ê³ÆÐÍÊý¾Ý½«±»×ª³É¶þÖµÐÍÊý¾Ý¡£
+    * ·ÖÎöÊý¾Ý£º»æ³öÊý¾ÝµÄ¿ÉÊÓ¶þÎ¬Í¼½«ÓÐÖúÓÚ¶ÔÊý¾Ý×ö³öÀí½âºÍ·ÖÎö£¬ÔÚ²ÉÓÃËõ¼õ·¨ÇóµÃÐÂ»Ø¹éÏµÊýÖ®ºó£¬¿ÉÒÔ½«ÐÂÄâºÏÏß»æÔÚÍ¼ÉÏ×÷Îª¶Ô±È¡£
+    * ÑµÁ·Ëã·¨£ºÕÒµ½»Ø¹éÏµÊý¡£
+    * ²âÊÔÊý¾Ý£ºÊ¹ÓÃRµÄÆ½·½»òÕßÔ¤²âÖµºÍÊý¾ÝµÄÄâºÏ¶È£¬À´·ÖÎöÄ£ÐÍµÄÐ§¹û¡£
+    * Ê¹ÓÃËã·¨£ºÊ¹ÓÃ»Ø¹é£¬¿ÉÒÔÔÚ¸ø¶¨ÊäÈëµÄÊ±ºòÔ¤²â³öÒ»¸öÊýÖµ£¬ÕâÊÇ¶Ô·ÖÀà·½·¨µÄÌáÉý£¬ÒòÎªÕâÑù¿ÉÒÔÔ¤²âÁ¬ÐøÐÍÊý¾Ý¶ø²»½ö½öÊÇÀëÉ¢µÄÀà±ð±êÇ©¡£
+* ×Ü½á
+    * Çó»Ø¹éÏµÊýµÄ¹ý³Ì¾ÍÊÇ»Ø¹é¡£
diff --git a/src/python/08.Predictive numerical data regression/regression.py b/src/python/08.Predictive numerical data regression/regression.py
new file mode 100644
index 00000000..be857aa7
--- /dev/null
+++ b/src/python/08.Predictive numerical data regression/regression.py	
@@ -0,0 +1,258 @@
+'''
+Create by ApacheCN-xy
+Date from 2017-02-27
+'''
+
+
+from numpy import *
+
+def loadDataSet(fileName):      #è§£æžä»¥tabé”®åˆ†éš”çš„æ–‡ä»¶ä¸­çš„æµ®ç‚¹æ•°
+    numFeat = len(open(fileName).readline().split('\t')) - 1 #èŽ·å¾—ä¸€è¡Œæœ‰å‡ ä¸ªå­—æ®µ 
+    dataMat = []; labelMat = []
+    fr = open(fileName)
+    for line in fr.readlines(): #è¯»å–æ¯ä¸€è¡Œ
+        lineArr =[]
+        curLine = line.strip().split('\t') #åˆ é™¤æ¯ä¸€è¡Œçš„å¼€å¤´å’Œç»“å°¾çš„tab
+        for i in range(numFeat):#ä»Ž0åˆ°3ï¼Œä¸åŒ…å«3
+            lineArr.append(float(curLine[i]))#å°†æ•°æ®æ·»åŠ åˆ°lineArr Listä¸­
+        dataMat.append(lineArr)
+        labelMat.append(float(curLine[-1]))
+    return dataMat,labelMat
+
+def standRegres(xArr,yArr):    #çº¿æ€§å›žå½’
+    xMat = mat(xArr); yMat = mat(yArr).T
+    xTx = xMat.T*xMat
+    if linalg.det(xTx) == 0.0:
+        print ("This matrix is singular, cannot do inverse")
+        return
+    ws = xTx.I * (xMat.T*yMat)
+    return ws
+
+def lwlr(testPoint,xArr,yArr,k=1.0):
+    xMat = mat(xArr); yMat = mat(yArr).T
+    m = shape(xMat)[0]
+    weights = mat(eye((m)))
+    for j in range(m):                      #ä¸‹é¢ä¸¤è¡Œåˆ›å»ºæƒé‡çŸ©é˜µ
+        diffMat = testPoint - xMat[j,:]     #
+        weights[j,j] = exp(diffMat*diffMat.T/(-2.0*k**2))
+    xTx = xMat.T * (weights * xMat)
+    if linalg.det(xTx) == 0.0:
+        print ("This matrix is singular, cannot do inverse")
+        return
+    ws = xTx.I * (xMat.T * (weights * yMat))
+    return testPoint * ws
+
+def lwlrTest(testArr,xArr,yArr,k=1.0):  #å¾ªçŽ¯æ‰€æœ‰çš„æ•°æ®ç‚¹ï¼Œå¹¶å°†lwlrè¿ç”¨äºŽæ‰€æœ‰çš„æ•°æ®ç‚¹
+    m = shape(testArr)[0]
+    yHat = zeros(m)
+    for i in range(m):
+        yHat[i] = lwlr(testArr[i],xArr,yArr,k)
+    return yHat
+
+def lwlrTestPlot(xArr,yArr,k=1.0):  #é¦–å…ˆå°† X æŽ’åºï¼Œå…¶ä½™çš„éƒ½ä¸ŽlwlrTestç›¸åŒï¼Œè¿™æ ·æ›´å®¹æ˜“ç»˜å›¾
+    yHat = zeros(shape(yArr))       
+    xCopy = mat(xArr)
+    xCopy.sort(0)
+    for i in range(shape(xArr)[0]):
+        yHat[i] = lwlr(xCopy[i],xArr,yArr,k)
+    return yHat,xCopy
+
+def rssError(yArr,yHatArr): #yArr å’Œ yHatArr ä¸¤è€…éƒ½éœ€è¦æ˜¯æ•°ç»„
+    return ((yArr-yHatArr)**2).sum()
+
+def ridgeRegres(xMat,yMat,lam=0.2):  #å²­å›žå½’
+    xTx = xMat.T*xMat
+    denom = xTx + eye(shape(xMat)[1])*lam
+    if linalg.det(denom) == 0.0:
+        print "This matrix is singular, cannot do inverse"
+        return
+    ws = denom.I * (xMat.T*yMat)
+    return ws
+    
+def ridgeTest(xArr,yArr):
+    xMat = mat(xArr); yMat=mat(yArr).T
+    yMean = mean(yMat,0)
+    yMat = yMat - yMean     #Yå–å¹³å‡å€¼ä»¥æ¶ˆé™¤X0
+    #regularize X'sï¼ˆæ­£åˆ™åŒ– Xçš„ï¼‰ï¼Ÿï¼Ÿï¼Ÿ
+    xMeans = mean(xMat,0)   #è®¡ç®—å¹³å‡å€¼ç„¶åŽå‡åŽ»å®ƒ
+    xVar = var(xMat,0)      #ç„¶åŽè®¡ç®—é™¤ä»¥ Xiçš„æ–¹å·®
+    xMat = (xMat - xMeans)/xVar
+    numTestPts = 30
+    wMat = zeros((numTestPts,shape(xMat)[1]))
+    for i in range(numTestPts):
+        ws = ridgeRegres(xMat,yMat,exp(i-10))
+        wMat[i,:]=ws.T
+    return wMat
+
+def regularize(xMat):#æŒ‰åˆ—è¿›è¡Œè§„èŒƒåŒ–
+    inMat = xMat.copy()
+    inMeans = mean(inMat,0)   #è®¡ç®—å¹³å‡å€¼ç„¶åŽå‡åŽ»å®ƒ
+    inVar = var(inMat,0)      #è®¡ç®—é™¤ä»¥Xiçš„æ–¹å·®
+    inMat = (inMat - inMeans)/inVar
+    return inMat
+
+def stageWise(xArr,yArr,eps=0.01,numIt=100):
+    xMat = mat(xArr); yMat=mat(yArr).T
+    yMean = mean(yMat,0)
+    yMat = yMat - yMean     #ä¹Ÿå¯ä»¥è§„åˆ™åŒ–ysä½†ä¼šå¾—åˆ°æ›´å°çš„coef
+    xMat = regularize(xMat)
+    m,n=shape(xMat)
+    #returnMat = zeros((numIt,n)) #æµ‹è¯•ä»£ç åˆ é™¤
+    ws = zeros((n,1)); wsTest = ws.copy(); wsMax = ws.copy()
+    for i in range(numIt):
+        print ws.T
+        lowestError = inf; 
+        for j in range(n):
+            for sign in [-1,1]:
+                wsTest = ws.copy()
+                wsTest[j] += eps*sign
+                yTest = xMat*wsTest
+                rssE = rssError(yMat.A,yTest.A)
+                if rssE < lowestError:
+                    lowestError = rssE
+                    wsMax = wsTest
+        ws = wsMax.copy()
+        #returnMat[i,:]=ws.T
+    #return returnMat
+
+#def scrapePage(inFile,outFile,yr,numPce,origPrc):
+#    from BeautifulSoup import BeautifulSoup
+#    fr = open(inFile); fw=open(outFile,'a') #a is append mode writing
+#    soup = BeautifulSoup(fr.read())
+#    i=1
+#    currentRow = soup.findAll('table', r="%d" % i)
+#    while(len(currentRow)!=0):
+#        title = currentRow[0].findAll('a')[1].text
+#        lwrTitle = title.lower()
+#        if (lwrTitle.find('new') > -1) or (lwrTitle.find('nisb') > -1):
+#            newFlag = 1.0
+#        else:
+#            newFlag = 0.0
+#        soldUnicde = currentRow[0].findAll('td')[3].findAll('span')
+#        if len(soldUnicde)==0:
+#            print "item #%d did not sell" % i
+#        else:
+#            soldPrice = currentRow[0].findAll('td')[4]
+#            priceStr = soldPrice.text
+#            priceStr = priceStr.replace('$','') #strips out $
+#            priceStr = priceStr.replace(',','') #strips out ,
+#            if len(soldPrice)>1:
+#                priceStr = priceStr.replace('Free shipping', '') #strips out Free Shipping
+#            print "%s\t%d\t%s" % (priceStr,newFlag,title)
+#            fw.write("%d\t%d\t%d\t%f\t%s\n" % (yr,numPce,newFlag,origPrc,priceStr))
+#        i += 1
+#        currentRow = soup.findAll('table', r="%d" % i)
+#    fw.close()
+    
+from time import sleep
+import json
+import urllib2
+def searchForSet(retX, retY, setNum, yr, numPce, origPrc):
+    sleep(10)
+    myAPIstr = 'AIzaSyD2cR2KFyx12hXu6PFU-wrWot3NXvko8vY'
+    searchURL = 'https://www.googleapis.com/shopping/search/v1/public/products?key=%s&country=US&q=lego+%d&alt=json' % (myAPIstr, setNum)
+    pg = urllib2.urlopen(searchURL)
+    retDict = json.loads(pg.read())
+    for i in range(len(retDict['items'])):
+        try:
+            currItem = retDict['items'][i]
+            if currItem['product']['condition'] == 'new':
+                newFlag = 1
+            else: newFlag = 0
+            listOfInv = currItem['product']['inventories']
+            for item in listOfInv:
+                sellingPrice = item['price']
+                if  sellingPrice > origPrc * 0.5:
+                    print "%d\t%d\t%d\t%f\t%f" % (yr,numPce,newFlag,origPrc, sellingPrice)
+                    retX.append([yr, numPce, newFlag, origPrc])
+                    retY.append(sellingPrice)
+        except: print 'problem with item %d' % i
+    
+def setDataCollect(retX, retY):
+    searchForSet(retX, retY, 8288, 2006, 800, 49.99)
+    searchForSet(retX, retY, 10030, 2002, 3096, 269.99)
+    searchForSet(retX, retY, 10179, 2007, 5195, 499.99)
+    searchForSet(retX, retY, 10181, 2007, 3428, 199.99)
+    searchForSet(retX, retY, 10189, 2008, 5922, 299.99)
+    searchForSet(retX, retY, 10196, 2009, 3263, 249.99)
+    
+def crossValidation(xArr,yArr,numVal=10):
+    m = len(yArr)                           
+    indexList = range(m)
+    errorMat = zeros((numVal,30))#create error mat 30columns numVal rowsåˆ›å»ºerror mat 30columns numVal è¡Œ
+    for i in range(numVal):
+        trainX=[]; trainY=[]
+        testX = []; testY = []
+        random.shuffle(indexList)
+        for j in range(m):#create training set based on first 90% of values in indexList
+                          #åŸºäºŽindexListä¸­çš„å‰90%çš„å€¼åˆ›å»ºè®­ç»ƒé›†
+            if j < m*0.9: 
+                trainX.append(xArr[indexList[j]])
+                trainY.append(yArr[indexList[j]])
+            else:
+                testX.append(xArr[indexList[j]])
+                testY.append(yArr[indexList[j]])
+        wMat = ridgeTest(trainX,trainY)    #get 30 weight vectors from ridge
+        for k in range(30):#loop over all of the ridge estimates
+            matTestX = mat(testX); matTrainX=mat(trainX)
+            meanTrain = mean(matTrainX,0)
+            varTrain = var(matTrainX,0)
+            matTestX = (matTestX-meanTrain)/varTrain #regularize test with training params
+            yEst = matTestX * mat(wMat[k,:]).T + mean(trainY)#test ridge results and store
+            errorMat[i,k]=rssError(yEst.T.A,array(testY))
+            #print errorMat[i,k]
+    meanErrors = mean(errorMat,0)#calc avg performance of the different ridge weight vectors
+    minMean = float(min(meanErrors))
+    bestWeights = wMat[nonzero(meanErrors==minMean)]
+    #can unregularize to get model
+    #when we regularized we wrote Xreg = (x-meanX)/var(x)
+    #we can now write in terms of x not Xreg:  x*w/var(x) - meanX/var(x) +meanY
+    xMat = mat(xArr); yMat=mat(yArr).T
+    meanX = mean(xMat,0); varX = var(xMat,0)
+    unReg = bestWeights/varX
+    print "the best model from Ridge Regression is:\n",unReg
+    print "with constant term: ",-1*sum(multiply(meanX,unReg)) + mean(yMat)
+
+
+
+
+
+
+
+
+
+
+    #test for xianxinghuigui
+    def regression1():
+    xArr, yArr = loadDataSet("ex0.txt")
+    xMat = mat(xArr)
+    yMat = mat(yArr)
+    ws = standRegres(xArr, yArr)
+    fig = plt.figure()
+    ax = fig.add_subplot(111)
+    ax.scatter(xMat[:, 1].flatten(), yMat.T[:, 0].flatten().A[0])
+    xCopy = xMat.copy() 
+    xCopy.sort(0)
+    yHat = xCopy * ws
+    ax.plot(xCopy[:, 1], yHat)
+    plt.show()
+
+if __name__ == "__main__":
+    regression1()
+
+
+    #test for jiaquanhuigui
+    def regression1():
+    xArr, yArr = loadDataSet("ex0.txt")
+    yHat = lwlrTest(xArr, xArr, yArr, 0.003)
+    xMat = mat(xArr)
+    srtInd = xMat[:,1].argsort(0)
+    xSort=xMat[srtInd][:,0,:]
+    fig = plt.figure()
+    ax = fig.add_subplot(111)
+    ax.plot(xSort[:,1], yHat[srtInd])
+    ax.scatter(xMat[:,1].flatten().A[0], mat(yArr).T.flatten().A[0] , s=2, c='red')
+    plt.show()
+
+if __name__ == "__main__":
+    regression1()
\ No newline at end of file
diff --git a/src/python/10.kmeans/kMeans.py b/src/python/10.kmeans/kMeans.py
new file mode 100644
index 00000000..b485ce14
--- /dev/null
+++ b/src/python/10.kmeans/kMeans.py
@@ -0,0 +1,50 @@
+#!/usr/bin/python
+# coding:utf8
+
+from numpy import *
+
+# ä»Žæ–‡æœ¬ä¸­æž„å»ºçŸ©é˜µï¼ŒåŠ è½½æ–‡æœ¬æ–‡ä»¶ï¼Œç„¶åŽå¤„ç†
+def loadDataSet(fileName):      # é€šç”¨å‡½æ•°ï¼Œç”¨æ¥è§£æžä»¥ tab é”®åˆ†éš”çš„ floatsï¼ˆæµ®ç‚¹æ•°ï¼‰
+    dataMat = []                # assume last column is target value
+    fr = open(fileName)
+    for line in fr.readlines():
+        curLine = line.strip().split('\t')
+        fltLine = map(float,curLine) # æ˜ å°„æ‰€æœ‰çš„å…ƒç´ ä¸º floatï¼ˆæµ®ç‚¹æ•°ï¼‰ç±»åž‹
+        dataMat.append(fltLine)
+    return dataMat
+
+# è®¡ç®—ä¸¤ä¸ªå‘é‡çš„æ¬§å¼è·ç¦»ï¼ˆå¯æ ¹æ®åœºæ™¯é€‰æ‹©ï¼‰
+def distEclud(vecA, vecB):
+    return sqrt(sum(power(vecA - vecB, 2))) # la.norm(vecA-vecB)
+
+# ä¸ºç»™å®šæ•°æ®é›†æž„å»ºä¸€ä¸ªåŒ…å« k ä¸ªéšæœºè´¨å¿ƒçš„é›†åˆã€‚éšæœºè´¨å¿ƒå¿…é¡»è¦åœ¨æ•´ä¸ªæ•°æ®é›†çš„è¾¹ç•Œä¹‹å†…ï¼Œè¿™å¯ä»¥é€šè¿‡æ‰¾åˆ°æ•°æ®é›†æ¯ä¸€ç»´çš„æœ€å°å’Œæœ€å¤§å€¼æ¥å®Œæˆã€‚ç„¶åŽç”Ÿæˆ 0~1.0 ä¹‹é—´çš„éšæœºæ•°å¹¶é€šè¿‡å–å€¼èŒƒå›´å’Œæœ€å°å€¼ï¼Œä»¥ä¾¿ç¡®ä¿éšæœºç‚¹åœ¨æ•°æ®çš„è¾¹ç•Œä¹‹å†…ã€‚
+def randCent(dataSet, k):
+    n = shape(dataSet)[1] # åˆ—æ•°
+    centroids = mat(zeros((k,n))) # åˆ›å»ºè´¨å¿ƒçŸ©é˜µ
+    for j in range(n): # ç©¿ä»¶éšæœºç°‡è´¨å¿ƒï¼Œå¹¶ä¸”åœ¨æ¯ä¸€ç»´çš„è¾¹ç•Œå†…
+        minJ = min(dataSet[:,j]) 
+        rangeJ = float(max(dataSet[:,j]) - minJ)
+        centroids[:,j] = mat(minJ + rangeJ * random.rand(k,1)) # éšæœºç”Ÿæˆ
+    return centroids
+
+# k-means èšç±»ç®—æ³•
+def kMeans(dataSet, k, distMeas=distEclud, createCent=randCent):
+    m = shape(dataSet)[0]
+    clusterAssment = mat(zeros((m,2))) # åˆ›å»ºçŸ©é˜µæ¥åˆ†é…æ•°æ®ç‚¹åˆ°è´¨å¿ƒä¸­
+    centroids = createCent(dataSet, k)
+    clusterChanged = True
+    while clusterChanged:
+        clusterChanged = False
+        for i in range(m): # å¾ªçŽ¯æ¯ä¸€ä¸ªæ•°æ®ç‚¹å¹¶åˆ†é…åˆ°æœ€è¿‘çš„è´¨å¿ƒä¸­åŽ»
+            minDist = inf; minIndex = -1
+            for j in range(k):
+                distJI = distMeas(centroids[j,:],dataSet[i,:])
+                if distJI < minDist:
+                    minDist = distJI; minIndex = j
+            if clusterAssment[i,0] != minIndex: clusterChanged = True
+            clusterAssment[i,:] = minIndex,minDist**2
+        print centroids
+        for cent in range(k): # é‡æ–°è®¡ç®—è´¨å¿ƒ
+            ptsInClust = dataSet[nonzero(clusterAssment[:,0].A==cent)[0]] # èŽ·å–è¯¥ç°‡ä¸­çš„æ‰€æœ‰ç‚¹
+            centroids[cent,:] = mean(ptsInClust, axis=0) # åˆ†é…è´¨å¿ƒ
+    return centroids, clusterAssment