十年網(wǎng)站開發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營(yíng)維護(hù)+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
這篇文章主要為大家展示了“spark mllib 分類預(yù)測(cè)之如何實(shí)現(xiàn)邏輯回歸 ”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“spark mllib 分類預(yù)測(cè)之如何實(shí)現(xiàn)邏輯回歸 ”這篇文章吧。
創(chuàng)新互聯(lián)的客戶來自各行各業(yè),為了共同目標(biāo),我們?cè)诠ぷ魃厦芮信浜?,從?chuàng)業(yè)型小企業(yè)到企事業(yè)單位,感謝他們對(duì)我們的要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來驚喜。專業(yè)領(lǐng)域包括成都網(wǎng)站建設(shè)、成都做網(wǎng)站、電商網(wǎng)站開發(fā)、微信營(yíng)銷、系統(tǒng)平臺(tái)開發(fā)。
腎細(xì)胞癌轉(zhuǎn)移情況(有轉(zhuǎn)移 y=1,無轉(zhuǎn)移 y=2) x1:確診時(shí)患者年齡(歲) x2:腎細(xì)胞癌血管內(nèi)皮生長(zhǎng)因子(VEGF),其陽(yáng)性表述由低到高共3個(gè)等級(jí) x3:腎細(xì)胞癌組織內(nèi)微血管數(shù)(MVC) x4:腎癌細(xì)胞核組織學(xué)分級(jí),由低到高共4級(jí) x5:腎細(xì)胞癌分期,由低到高共4級(jí) y x1 x2 x3 x4 x50 59 2 43.4 2 1
package spark.logisticRegression import org.apache.spark.mllib.classification.LogisticRegressionWithSGD import org.apache.spark.mllib.evaluation.MulticlassMetrics import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.mllib.regression.LabeledPoint import org.apache.spark.mllib.util.MLUtils import org.apache.spark.{SparkConf, SparkContext} /** * MLLib分類,邏輯回歸,是分類,不是回歸 * 胃癌轉(zhuǎn)移判斷 * Created by eric on 16-7-17. */ object LogisticRegression4 { val conf = new SparkConf() //創(chuàng)建環(huán)境變量 .setMaster("local") //設(shè)置本地化處理 .setAppName("LogisticRegression4")//設(shè)定名稱 val sc = new SparkContext(conf) def main(args: Array[String]) { val data = MLUtils.loadLibSVMFile(sc, "./src/main/spark/logisticRegression/wa.txt") //讀取數(shù)據(jù)文件,一定注意文本格式 val splits = data.randomSplit(Array(0.7, 0.3), seed = 11L) //對(duì)數(shù)據(jù)集切分 val parsedData = splits(0) //分割訓(xùn)練數(shù)據(jù) val parseTtest = splits(1) //分割測(cè)試數(shù)據(jù) val model = LogisticRegressionWithSGD.train(parsedData,50) //訓(xùn)練模型 val predictionAndLabels = parseTtest.map {//計(jì)算測(cè)試值 case LabeledPoint(label, features) => //計(jì)算測(cè)試值 val prediction = model.predict(features)//計(jì)算測(cè)試值 (prediction, label) //存儲(chǔ)測(cè)試和預(yù)測(cè)值 } val metrics = new MulticlassMetrics(predictionAndLabels)//創(chuàng)建驗(yàn)證類 val precision = metrics.precision //計(jì)算驗(yàn)證值 println("Precision = " + precision) //打印驗(yàn)證值 val patient = Vectors.dense(Array(70,3,180.0,4,3)) //計(jì)算患者可能性 val prediction = model.predict(patient) if(prediction == 1) println("患者的胃癌有幾率轉(zhuǎn)移。")//做出判斷 else println("患者的胃癌沒有幾率轉(zhuǎn)移。") //做出判斷 //Precision = 0.3333333333333333 //患者的胃癌沒有幾率轉(zhuǎn)移。 } }
0 1:59 2:2 3:43.4 4:2 5:1 0 1:36 2:1 3:57.2 4:1 5:1 0 1:61 2:2 3:190 4:2 5:1 1 1:58 2:3 3:128 4:4 5:3 1 1:55 2:3 3:80 4:3 5:4 0 1:61 2:1 3:94 4:4 5:2 0 1:38 2:1 3:76 4:1 5:1 0 1:42 2:1 3:240 4:3 5:2 0 1:50 2:1 3:74 4:1 5:1 0 1:58 2:2 3:68.6 4:2 5:2 0 1:68 2:3 3:132.8 4:4 5:2 1 1:25 2:2 3:94.6 4:4 5:3 0 1:52 2:1 3:56 4:1 5:1 0 1:31 2:1 3:47.8 4:2 5:1 1 1:36 2:3 3:31.6 4:3 5:1 0 1:42 2:1 3:66.2 4:2 5:1 1 1:14 2:3 3:138.6 4:3 5:3 0 1:32 2:1 3:114 4:2 5:3 0 1:35 2:1 3:40.2 4:2 5:1 1 1:70 2:3 3:177.2 4:4 5:3 1 1:65 2:2 3:51.6 4:4 5:4 0 1:45 2:2 3:124 4:2 5:4 1 1:68 2:3 3:127.2 4:3 5:3 0 1:31 2:2 3:124.8 4:2 5:3
以上是“spark mllib 分類預(yù)測(cè)之如何實(shí)現(xiàn)邏輯回歸 ”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!