十年網(wǎng)站開發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊
量身定制 + 運(yùn)營維護(hù)+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務(wù)器提供商,新人活動買多久送多久,劃算不套路!
小編這次要給大家分享的是詳解Python常用數(shù)據(jù)分析模塊,文章內(nèi)容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。
前言
python是一門優(yōu)秀的編程語言,而是python成為數(shù)據(jù)分析軟件的是因?yàn)閜ython強(qiáng)大的擴(kuò)展模塊。也就是這些python的擴(kuò)展包讓python可以做數(shù)據(jù)分析,主要包括numpy,scipy,pandas,matplotlib,scikit-learn等等諸多強(qiáng)大的模塊,在結(jié)合上ipython交互工具 ,以及python強(qiáng)大的爬蟲數(shù)據(jù)獲取能力,字符串處理能力,讓python成為完整的數(shù)據(jù)分析工具。
numpy
官網(wǎng):https://www.scipy.org/
NumPy(Numerical Python的簡稱)是高性能科學(xué)計算和數(shù)據(jù)分析的基礎(chǔ)包。NumPy最重要的一個特點(diǎn)就是其N維數(shù)組對象(即ndarray),該對象是一個快速而靈活的大數(shù)據(jù)集容器??梢岳眠@種數(shù)組對整塊數(shù)據(jù)執(zhí)行一些數(shù)學(xué)運(yùn)算,比python自帶的數(shù)組以及元組效率更高,其語法跟變量元素之間的運(yùn)算一樣,無需進(jìn)行循環(huán)操作。
在使用python進(jìn)行數(shù)據(jù)分析的過程中,我們大部分時候是不會直接使用numpy包,而是其他包要用到numpy??梢哉fnumpy是整個python數(shù)據(jù)分析工作的基石。
舉個簡單的案例,我們要計算100000個隨機(jī)數(shù)的值,如果傳統(tǒng)編程需要寫循環(huán),用了2.2s,而使用numpy數(shù)據(jù)結(jié)構(gòu),則可以進(jìn)行向量化操作,無需循環(huán),只需要28.2ms節(jié)約大量時間。
In [1]: import numpy In [2]: my_arr = np.arange(1000000) In [3]: my_list = list(range(1000000)) In [4]: %time for _ in range(10): my_arr2 = my_arr * 2 Wall time: 28.2 ms In [5]: %time for _ in range(10): my_list2 = [x * 2 for x in my_list] Wall time: 2.2 s