資料來源:https://kmweb.coa.gov.tw/subject/subject.php?id=5178
範例一:列印111年各縣市百香果的產量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣', '合 計'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26, 939.57], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26, 914.92], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373, 22591], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177, 20668818] } df = pd.DataFrame(data) # 顯示數據 print(df) |
執行結果:
縣市名稱 種植面積(公頃) 結實面積(公頃) 每公頃收量(公斤) 收量(公斤)
0 新北市 4.78 4.49 11201 50291
1 宜蘭縣 6.78 5.47 11180 61155
2 桃園市 3.13 2.95 14615 43115
3 新竹縣 3.41 3.41 15334 52290
4 苗栗縣 19.19 19.19 18728 359395
5 台中市 64.58 64.38 17493 1126224
6 彰化縣 20.75 20.75 12868 267003
7 南投縣 643.82 633.68 26124 16554117
8 雲林縣 12.40 12.40 16652 206487
9 嘉義縣 27.58 27.58 11191 308652
10 台南市 21.94 21.94 16837 369393
11 高雄市 35.58 28.71 13937 400141
12 屏東縣 46.40 42.94 11328 486436
13 台東縣 14.11 14.11 15096 212999
14 花蓮縣 12.33 10.13 12871 130384
15 基隆市 0.40 0.40 3337 1335
16 嘉義市 0.45 0.45 42000 18900
17 台北市 1.68 1.68 10907 18324
18 金門縣 0.26 0.26 8373 2177
19 合 計 939.57 914.92 22591 20668818
範例二:顯示前五筆資料
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣', '合 計'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26, 939.57], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26, 914.92], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373, 22591], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177, 20668818] } df = pd.DataFrame(data) # 顯示前5筆資料 print(df.head()) |
執行結果:
縣市名稱 種植面積(公頃) 結實面積(公頃) 每公頃收量(公斤) 收量(公斤)
0 新北市 4.78 4.49 11201 50291
1 宜蘭縣 6.78 5.47 11180 61155
2 桃園市 3.13 2.95 14615 43115
3 新竹縣 3.41 3.41 15334 52290
4 苗栗縣 19.19 19.19 18728 359395
範例三:顯示前十筆資料
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣', '合 計'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26, 939.57], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26, 914.92], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373, 22591], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177, 20668818] } df = pd.DataFrame(data) # 顯示前10筆資料 print(df.head(10)) |
執行結果:
縣市名稱 種植面積(公頃) 結實面積(公頃) 每公頃收量(公斤) 收量(公斤)
0 新北市 4.78 4.49 11201 50291
1 宜蘭縣 6.78 5.47 11180 61155
2 桃園市 3.13 2.95 14615 43115
3 新竹縣 3.41 3.41 15334 52290
4 苗栗縣 19.19 19.19 18728 359395
5 台中市 64.58 64.38 17493 1126224
6 彰化縣 20.75 20.75 12868 267003
7 南投縣 643.82 633.68 26124 16554117
8 雲林縣 12.40 12.40 16652 206487
9 嘉義縣 27.58 27.58 11191 308652
範例四: 顯示最後10筆資料
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣', '合 計'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26, 939.57], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26, 914.92], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373, 22591], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177, 20668818] } df = pd.DataFrame(data) # 顯示後10筆資料 print(df.tail(10)) |
執行結果:
縣市名稱 種植面積(公頃) 結實面積(公頃) 每公頃收量(公斤) 收量(公斤)
10 台南市 21.94 21.94 16837 369393
11 高雄市 35.58 28.71 13937 400141
12 屏東縣 46.40 42.94 11328 486436
13 台東縣 14.11 14.11 15096 212999
14 花蓮縣 12.33 10.13 12871 130384
15 基隆市 0.40 0.40 3337 1335
16 嘉義市 0.45 0.45 42000 18900
17 台北市 1.68 1.68 10907 18324
18 金門縣 0.26 0.26 8373 2177
19 合 計 939.57 914.92 22591 20668818
以下的範例把合計欄位拿掉
範例五:獲取縣市名稱欄位的數據
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 獲取縣市名稱欄位的數據 city_names = df['縣市名稱'] print(city_names) |
執行結果:
0 新北市
1 宜蘭縣
2 桃園市
3 新竹縣
4 苗栗縣
5 台中市
6 彰化縣
7 南投縣
8 雲林縣
9 嘉義縣
10 台南市
11 高雄市
12 屏東縣
13 台東縣
14 花蓮縣
15 基隆市
16 嘉義市
17 台北市
18 金門縣
Name: 縣市名稱, dtype: object
範例六:獲取收量欄位的數據
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 獲取收量欄位的數據 harvest_amounts = df['收量(公斤)'] print(harvest_amounts) |
執行結果:
0 50291
1 61155
2 43115
3 52290
4 359395
5 1126224
6 267003
7 16554117
8 206487
9 308652
10 369393
11 400141
12 486436
13 212999
14 130384
15 1335
16 18900
17 18324
18 2177
Name: 收量(公斤), dtype: int64
範例七:獲取第7行的數據
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 獲取第7行的數據 row_1 = df.loc[7] print(row_1) |
執行結果:
縣市名稱 南投縣
種植面積(公頃) 643.82
結實面積(公頃) 633.68
每公頃收量(公斤) 26124
收量(公斤) 16554117
Name: 7, dtype: object
範例八:獲取第一行到第五行的數據
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 獲取第一行到第五行的數據 rows_1_to_5 = df.loc[0:4] print(rows_1_to_5) |
執行結果:
縣市名稱 種植面積(公頃) 結實面積(公頃) 每公頃收量(公斤) 收量(公斤)
0 新北市 4.78 4.49 11201 50291
1 宜蘭縣 6.78 5.47 11180 61155
2 桃園市 3.13 2.95 14615 43115
3 新竹縣 3.41 3.41 15334 52290
4 苗栗縣 19.19 19.19 18728 359395
範例九:獲取收量大於100,000公斤的縣市
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 根據條件獲取數據(例如,獲取收量大於100,000公斤的縣市) high_harvest = df[df['收量(公斤)'] > 100000] print(high_harvest) |
執行結果:
縣市名稱 種植面積(公頃) 結實面積(公頃) 每公頃收量(公斤) 收量(公斤)
4 苗栗縣 19.19 19.19 18728 359395
5 台中市 64.58 64.38 17493 1126224
6 彰化縣 20.75 20.75 12868 267003
7 南投縣 643.82 633.68 26124 16554117
8 雲林縣 12.40 12.40 16652 206487
9 嘉義縣 27.58 27.58 11191 308652
10 台南市 21.94 21.94 16837 369393
11 高雄市 35.58 28.71 13937 400141
12 屏東縣 46.40 42.94 11328 486436
13 台東縣 14.11 14.11 15096 212999
14 花蓮縣 12.33 10.13 12871 130384
範例十:計算平均種植面積
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 計算平均種植面積 average_planting_area = df['種植面積(公頃)'].mean() print(average_planting_area, "公頃") |
執行結果:
49.45105263157895 公頃
範例十一:計算最大結實面積
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 計算最大結實面積 max_yield_area = df['結實面積(公頃)'].max() print(max_yield_area, "公頃") |
執行結果:
633.68 公頃
範例十二:計算總收量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | import pandas as pd # 創建百香果種植數據 data = { '縣市名稱': ['新北市', '宜蘭縣', '桃園市', '新竹縣', '苗栗縣', '台中市', '彰化縣', '南投縣', '雲林縣', '嘉義縣', '台南市', '高雄市', '屏東縣', '台東縣', '花蓮縣', '基隆市', '嘉義市', '台北市', '金門縣'], '種植面積(公頃)': [4.78, 6.78, 3.13, 3.41, 19.19, 64.58, 20.75, 643.82, 12.4, 27.58, 21.94, 35.58, 46.4, 14.11, 12.33, 0.4, 0.45, 1.68, 0.26], '結實面積(公頃)': [4.49, 5.47, 2.95, 3.41, 19.19, 64.38, 20.75, 633.68, 12.4, 27.58, 21.94, 28.71, 42.94, 14.11, 10.13, 0.4, 0.45, 1.68, 0.26], '每公頃收量(公斤)': [11201, 11180, 14615, 15334, 18728, 17493, 12868, 26124, 16652, 11191, 16837, 13937, 11328, 15096, 12871, 3337, 42000, 10907, 8373], '收量(公斤)': [50291, 61155, 43115, 52290, 359395, 1126224, 267003, 16554117, 206487, 308652, 369393, 400141, 486436, 212999, 130384, 1335, 18900, 18324, 2177] } df = pd.DataFrame(data) # 計算總收量 total_harvest = df['收量(公斤)'].sum() print(total_harvest, "公斤") |
執行結果:
20668818 公斤