十年網(wǎng)站開(kāi)發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營(yíng)維護(hù)+專(zhuān)業(yè)推廣+無(wú)憂售后,網(wǎng)站問(wèn)題一站解決
python讀取數(shù)據(jù)的方法?這個(gè)問(wèn)題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見(jiàn)到的。希望通過(guò)這個(gè)問(wèn)題能讓你收獲頗深。下面是小編給大家?guī)?lái)的參考內(nèi)容,讓我們一起來(lái)看看吧!
創(chuàng)新互聯(lián)專(zhuān)注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站制作、網(wǎng)站建設(shè)、禮縣網(wǎng)絡(luò)推廣、小程序設(shè)計(jì)、禮縣網(wǎng)絡(luò)營(yíng)銷(xiāo)、禮縣企業(yè)策劃、禮縣品牌公關(guān)、搜索引擎seo、人物專(zhuān)訪、企業(yè)宣傳片、企業(yè)代運(yùn)營(yíng)等,從售前售中售后,我們都將竭誠(chéng)為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供禮縣建站搭建服務(wù),24小時(shí)服務(wù)熱線:18982081108,官方網(wǎng)址:www.cdcxhl.com
不論是數(shù)據(jù)分析,數(shù)據(jù)可視化,還是數(shù)據(jù)挖掘,一切的一切全都是以數(shù)據(jù)作為最基礎(chǔ)的元素。利用Python進(jìn)行數(shù)據(jù)分析,同樣最重要的一步就是如何將數(shù)據(jù)導(dǎo)入到Python中,然后才可以實(shí)現(xiàn)后面的數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)挖掘等。
在本期的Python學(xué)習(xí)中,我們將針對(duì)Python如何獲取外部數(shù)據(jù)做一個(gè)詳細(xì)的介紹:
讀取文本文件的數(shù)據(jù)
大家都知道,Python中pandas模塊是專(zhuān)門(mén)用來(lái)數(shù)據(jù)分析的一個(gè)強(qiáng)大工具,下面我們就來(lái)介紹pandas是如何讀取外部數(shù)據(jù)的。
In [1]: import pandas as pd In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')
對(duì)于中文的文本文件常容易因?yàn)榫幋a的問(wèn)題而讀取失敗,正如上所示。遇到這樣的編碼問(wèn)題該如何處置呢?解決辦法有兩種情況:
1)當(dāng)原始文件txt或csv的數(shù)據(jù)不是uft8格式時(shí),需要另存為utf8格式編碼;
2)如果原始的數(shù)據(jù)文件就是uft8格式,為了正常讀入,需要將read_csv函數(shù)的參數(shù)encoding設(shè)置為utf-8
將原始數(shù)據(jù)另存為utf8格式的數(shù)據(jù),重新讀入txt數(shù)據(jù)
In [3]: mydata_txt = pd.read_csv('C:\\test.txt',sep = '\t',encoding = 'utf-8') In [4]: mydata_txt
csv文本文件是非常常用的一種數(shù)據(jù)存儲(chǔ)格式,而且其存儲(chǔ)量要比Excel電子表格大很多,下面我們就來(lái)看看如何利用Python讀取csv格式的數(shù)據(jù)文件:
In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8') In [6]: mydata_csv
如果你善于總結(jié)的話,你會(huì)發(fā)現(xiàn),txt文件和csv文件均可以通過(guò)pandas模塊中的read_csv函數(shù)進(jìn)行讀取。該函數(shù)有20多個(gè)參數(shù),類(lèi)似于R中的read.table函數(shù),如果需要查看具體的參數(shù)詳情,可以查看幫助文檔:help(pandas.read_csv)。
讀取電子表格文件
這里所說(shuō)的電子表格就是Excel表格,可以是xls的電子表格,也可以是xlsx的電子表格。在日常工作中,很多數(shù)據(jù)都是存放在Excel電子表格中的,如果我們需要使用Python對(duì)其進(jìn)行分析或處理的話,第一步就是如何讀取Excel數(shù)據(jù)。下面我們來(lái)看看如果讀取Excel數(shù)據(jù)集:
In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8') In [8]: mydata_excel
感謝各位的閱讀!看完上述內(nèi)容,你們對(duì)python讀取數(shù)據(jù)的方法大概了解了嗎?希望文章內(nèi)容對(duì)大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。