計算迴歸曲線的MSE

原創

2020-02-23 03:39

import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.{LabeledPoint, LinearRegressionWithSGD}
import org.apache.spark.{SparkConf, SparkContext}
object kimiYang {
  var conf = new SparkConf()
  .setMaster("local")
  .setAppName("kimiYang");
  var sc = new SparkContext(conf);

  def main(args: Array[String]): Unit = {
    val data = sc.textFile("kimi.txt");
    val parsedData = data.map{line =>
      val parts = line.split('|');
      LabeledPoint(parts(0).toDouble,Vectors.dense(parts(1).split(',').map(_.toDouble)))
    }.cache();
    val model = LinearRegressionWithSGD.train(parsedData,10,0.1);
    println("model Weight" + model.weights)
    val valuesAndPreds = parsedData.map{point => {
      val prediction = model.predict(point.features);
      (point.label,prediction);
      }
    }
    val MSE = valuesAndPreds.map{case(v,p) => math.pow((v - p),2)}.mean();
    println("MSE" + MSE);

  }
}

結果：

model Weight[-2.1793201852602822E42,-4.305555405890157E44]

MSE1.4628747951573787E95

數據

65|7,400
90|5,1300
100|4,1100
110|3,1300
60|9,300
100|5,1000
75|7,600
80|6,1200
70|6,500
50|8,30

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【終極指南】使用Python可視化分析文本情感傾向

本文分享自華爲雲社區《Python理解文本情感傾向的終極指南》，作者：檸檬味擁抱。情感分析是一種通過自然語言處理技術來識別、提取和量化文本中的情感傾向的方法。Python在這一領域有着豐富的庫和工具，如NLTK、TextBlob和VAD

2024-05-28 10:58:03

地理數據可視化的神奇組合：Python和Geopandas

本文分享自華爲雲社區《Python與Geopandas：地理數據可視化與分析指南》，作者：檸檬味擁抱。地理數據可視化在許多領域都是至關重要的，無論是研究地理空間分佈、城市規劃、環境保護還是商業決策。Python語言以其強大的數據處理和可視

2024-05-15 10:59:41

詳解Python 中可視化數據分析工作流程

本文分享自華爲雲社區《Python 可視化數據分析從數據獲取到洞見發現的全面指南》，作者：檸檬味擁抱。在數據科學和分析的領域中，可視化是一種強大的工具，能夠幫助我們理解數據、發現模式，並得出洞見。Python 提供了豐富的庫和工具，使得可

2024-05-10 11:30:09

Python爬蟲技術與數據可視化：Numpy、pandas、Matplotlib的黃金組合

前言在當今信息爆炸的時代，數據已成爲企業決策和發展的關鍵。而互聯網作爲信息的主要來源，網頁中蘊含着大量的數據等待被挖掘。Python爬蟲技術和數據可視化工具的結合，爲我們提供了一個強大的工具箱，可以幫助我們從網絡中抓取數據，並將其可視

2024-04-29 23:26:28

從靜態到動態化，Python數據可視化中的Matplotlib和Seaborn

本文分享自華爲雲社區《Python數據可視化大揭祕：Matplotlib和Seaborn高效應用指南》，作者：檸檬味擁抱。安裝Matplotlib和Seaborn 首先，確保你已經安裝了Matplotlib和Seaborn庫。如果沒有

2024-03-25 11:01:41

深入學習NumPy庫在數據分析中的應用場景

在數據科學與機器學習領域，NumPy（Numerical Python）是一個經常被提及的重要工具。它是Python語言中一個非常強大的庫，提供了高性能的多維數組對象以及用於處理這些數組的工具。NumPy不僅僅是一個用於數值計算的庫，它還

2024-03-02 00:30:28

微博數據可視化分析：利用Python構建信息圖表展示話題熱度

1. 引言隨着社交媒體的迅速發展，微博已成爲人們交流觀點、表達情感的重要平臺之一。微博評論數據蘊含着豐富的信息，通過對這些數據進行分析和可視化，我們可以深入瞭解用戶對特定話題的關注程度和情感傾向。本文將介紹如何利用Python進行微博

2024-02-20 00:22:15

概率論整理(三)

接概率論整理(二) 大數定律背後的理論支撐一組獨立同分布的隨機變量：\(X_1,X_2,X_3,...,X_n\)，期望μ，方差\(σ^2\)，則這組隨機變量的均值爲 \(M_n={X_1+X_2+X_3+...+X_n\over n}

2023-06-24 01:43:15

RALB負載均衡算法的應用 | 京東雲技術團隊

一、背景搜索推薦算法架構爲京東集團所有的搜索推薦業務提供服務，實時返回處理結果給上游。部門各子系統已經實現了基於CPU的自適應限流，但是Client端對Server端的調用依然是RR輪詢的方式，沒有考慮下游機器性能差異的情況，無法最大化利

2023-06-09 11:50:40

OpenCV 中的圖像處理 003_圖像閾值

本文主要內容來自於 OpenCV-Python 教程的 OpenCV 中的圖像處理部分，這部分的全部主要內容如下：改變色彩空間學習在不同色彩空間之間改變圖像。另外學習跟蹤視頻中的彩色對象。圖像的幾何變換學習對圖像應用不同

2022-04-30 09:19:00

在 matplotlib 中反轉 imshow 顯示的圖像 - Invert image displayed by imshow in matplotlib

問題： I wanted the imshow() function in matplotlib.pyplot to display images the opposite way, ie upside down.我希望matplotli

2021-12-26 21:18:05

第一次結對作業——“停課不停學”網上教學情況調查可視化呈現

這個作業屬於哪個課程軟件工程王彥傑學號：211702338 董爽學號：211714164 這個作業要求在哪裏第一次結對作業這個作業的目標由於此次疫情非常嚴重，全國大學生不得不在家裏進行網上上課。我們針

2021-12-25 21:38:52

如何刪除 matplotlib 中的頂部和右側軸？ - How can I remove the top and right axis in matplotlib?

問題： Instead of the default "boxed" axis style I want to have only the left and bottom axis, ie:而不是默認的“盒裝”軸樣式，我只想擁有左軸和底軸

2021-10-24 21:16:17

Tensorflow技術點整理

我們用tensorflow2來看一個服飾數據集的識別。 import numpy as np import matplotlib.pyplot as plt import tensorflow as tf from tensor

2021-10-21 21:19:52

如何在沒有root訪問權限的情況下安裝python模塊？ - How to install python modules without root access?

問題： I'm taking some university classes and have been given an 'instructional account', which is a school account I can

2021-10-13 09:16:03

24小時熱門文章

最新文章

最新評論文章