十年網(wǎng)站開發(fā)經(jīng)驗 + 多家企業(yè)客戶 + 靠譜的建站團隊
量身定制 + 運營維護+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
pandas是python中用于數(shù)據(jù)分析和處理的一個基于numpy的基本庫工具,是從事python語言數(shù)據(jù)領(lǐng)域的一個基本入門工具,常見用途有:
a提供高級的數(shù)據(jù)結(jié)構(gòu)和相當豐富的數(shù)據(jù)操作API
b提高了對復(fù)雜矩陣運算的效率(這里的矩陣,目前可簡單視作Excel數(shù)據(jù)表,自己腦補一下)
c提供了數(shù)據(jù)清洗和處理功能
d幫助數(shù)據(jù)挖掘挖掘分析
創(chuàng)新互聯(lián)公司堅持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都做網(wǎng)站、成都網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時代的沾益網(wǎng)站設(shè)計、移動媒體設(shè)計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!
回歸正題:代碼如下(環(huán)境:anaconda3+python3)
運行代碼時:
pandas兩個重要的數(shù)據(jù)結(jié)構(gòu):Series和DataFrame
對象方法unstack(): Series對象的API,用于將Series的數(shù)據(jù)類型轉(zhuǎn)DataFrame類型,因為DataFrame提供的數(shù)據(jù)操作API遠遠多于Series。(Series視作一維,DataFrame視作高維數(shù)據(jù),類比一維數(shù)組和高維度數(shù)組)
用unstack操作的數(shù)據(jù)必須唯一標識,而打印obj1如下:
存在重復(fù),unstack不能唯一區(qū)分,故轉(zhuǎn)換失敗報錯ValueError: Index contains duplicate entries, cannot reshape, 解決方式:修改字母索引名或者數(shù)字索引,只要能夠唯一標識即可,如將重復(fù)的1改為2(這里不能為3)或改為字母
將層次索引的外層索引(這里指a,b,c)作為DataFrame的行索引,內(nèi)層索引(1,2,3....)作為列索引.結(jié)果打印如下:
思考一下: 既然Series轉(zhuǎn)DataFrame,可使用unstack()[解包], 那DataFrame轉(zhuǎn)Series用什么方法?
答案: 使用stack() [打包]