Pandas是一個開源的,BSD許可的庫,為Python編程語言提供高性能,易于使用的數據結構和數據分析工具。 Pandas是NumFOCUS贊助的項目。這將有助于確保Pandas成為世界級開源項目的成功,并有可能捐贈給該項目。
Pandas 是 Python 的核心數據分析支持庫,提供了快速、靈活、明確的數據結構,旨在簡單、直觀地處理關系型、標記型數據。Pandas 的目標是成為 Python 數據分析實踐與實戰(zhàn)的必備高級工具,其長遠目標是成為最強大、最靈活、可以支持任何語言的開源數據分析工具。經過多年不懈的努力,Pandas 離這個目標已經越來越近了。
Pandas 適用于處理以下類型的數據:
Pandas 的主要數據結構是 Series(一維數據)與 DataFrame(二維數據),這兩種數據結構足以處理金融、統(tǒng)計、社會科學、工程等領域里的大多數典型用例。對于 R 用戶,DataFrame 提供了比 R 語言 data.frame 更豐富的功能。Pandas 基于 NumPy 開發(fā),可以與其它第三方科學計算支持庫完美集成。
Pandas 就像一把萬能瑞士軍刀,下面僅列出了它的部分優(yōu)勢 :
這些功能主要是為了解決其它編程語言、科研環(huán)境的痛點。處理數據一般分為幾個階段:數據整理與清洗、數據分析與建模、數據可視化與制表,Pandas 是處理數據的理想工具。
其它說明:
掃描下方二維碼或打開微信搜一搜“w3cschool編程獅”關注公眾號回復關鍵詞【Python123】或者【Python資料包】免費領取 Python 學習資料,包含軟件安裝包,電子書、思維導圖等