Pandas 教程

Pandas 是 Python 語言的一個擴展程序庫,用於數據分析。

Pandas 是一個開放源碼、BSD 許可的庫,提供高性能、易於使用的數據結構和數據分析工具。

Pandas 名字衍生自術語 "panel data"(麵板數據)和 "Python data analysis"(Python 數據分析)。

Pandas 一個強大的分析結構化數據的工具集,基礎是 Numpy(提供高性能的矩陣運算)。

Pandas 可以從各種文件格式比如 CSV、JSON、SQL、Microsoft Excel 導入數據。

Pandas 可以對各種數據進行運算操作,比如歸並、再成形、選擇,還有數據清洗和數據加工特征。

Pandas 廣泛應用在學術、金融、統計學等各個數據分析領域。


學習本教程前你需要了解

在開學習 Pandas 教程之前,我們需要具備基本的 Python 基礎,如果你對 Python還不了解,可以閱讀我們的教程:


Pandas 應用

Pandas 的主要數據結構是 Series (一維數據)與 DataFrame(二維數據),這兩種數據結構足以處理金融、統計、社會科學、工程等領域裏的大多數典型用例。


數據結構

Series 是一種類似於一維數組的對象,它由一組數據(各種Numpy數據類型)以及一組與之相關的數據標簽(即索引)組成。

DataFrame 是一個表格型的數據結構,它含有一組有序的列,每列可以是不同的值類型(數值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個索引)。


相關鏈接