跳到主要內容

[HowTo] 用Tableau Public 來創建COVID-19疫情分析視圖


隨著新冠肺炎(COVID-19)在武漢爆發至今,全球各地也都受到相當嚴重的疫情影響。
每天看著新聞,看著記者會關心各地數據的變化,想動手做點甚麼又發現光是要蒐集全球數據就頗具挑戰。

我的問題,似乎也是大家的問題。剛好在三月下旬 Tableau公布了一個COVID-19 Data Hub計畫。

Tableau COVID-19 Data Hub 旨在提供公眾能透過此計畫提供的公開數據服務,看見數據、了解數據做出有效決策。
計畫中的數據由約翰霍普金斯大學(Johns Hopkins University)提供,透過Tableau Prep將其數據進行整理與清洗,提供全球各國每日疫情的確診死亡案例數,部分國家還可以細看到州/省的數字。
點入該計畫網頁,可以看到由TableauTableau Community 提供的疫情分析視圖之外,還可以找到Tableau的公眾數據服務連接方式。

Tableau COVID-19 Data Hub 目前提供三種數據連接方式
  1. Amazon Web Services (AWS)透過AWS的數據平台,適合已經具有AWS帳號與相關使用經驗者
  2. data.world可以透過data.world 平台直接下載CSV or Hyper 格式的數據檔案,此外data.world 也提供Tableau Web Data Connector (WDC) 連接。CSV or Hyper 下載使用很方便,但必須每日自己手動下載更新數據;如果使用WDC 可以讓Tableau 每次開啟時就直接連到data.world 就取得最新數據。
  3. Google Sheets
    如果你是使用Tableau Public,加上你想要把最終的視圖發布在網路上,那使用Google Sheets是最適合的選擇。只要先開啟 View in Google Sheets 之後就可以在Tableau Desktop/Tableau Public上開啟Google Sheets 連接器來創建自己的分析。加上,Tableau Public 可以每隔24小時重新擷取來源為Google Sheets的數據,做完的視圖就可以放心讓它自動更新囉。

看到這,是不是也想動手做做看!!
以下簡單示範如何使用Tableau Public連接數據,以及完成後發布視圖,如果你是使用Tableau Desktop只有在最後發布時的步驟略有不同。
  1. 先開啟資料集的連結 View in Google Sheets你會在此發現,Google Sheets 檔案名稱為COVID-19 Cases,且數據分為兩個Sheets,分別是COVID-19 Deaths & COVID-19 Confirmed
    兩個Sheets欄位資料型態都相同,實際上就是一個是確診,另一個是死亡的數據,我們可以稍後在Tableau當中把它們合併起來就好。
  2. 開啟Tableau Public,並選擇資料來源Google表格,這時會需要在瀏覽器視窗確認同意Tableau 連接您的Google Sheets。完成後就可以看到如下畫面,找到COVID-19 Cases,就可以點選右下角的連接。
  3. Tableau 資料來源頁籤,因為我們已經知道資料分布在兩個不同的Sheets,所以先選擇新建並集(Union)
    然後因為我們兩個Sheets都要,所以直接選擇萬用字元(自動)Tableau就會幫我們把COVID-19 Cases檔案下所有sheets都合併起來。
  4. 完成並集後,數據就已經乾淨整齊的可以使用囉。各個欄位資訊基本上如其名稱不難了解,也可以參照 View in AWS Data ExchangeAWS這邊有詳細說明。
  5. 有了數據後,再來就是您的時間囉! 花點時間思考用甚麼角度,用甚麼方式來看這數據。完成分析視圖後,就可以分享給全世界!!!
  6. 如何將工作簿發布至Tableau Public?在工具列當中,直接點選儲存(CTRL+S)
    再輸入工作簿在Tableau Public的標題,並記得勾選嵌入Google憑證
    發布後會自動開啟瀏覽器視窗,可以編輯詳細資訊
  7. 詳細資訊中可以開啟/關閉[使用Google工作表更新資料],也可以要求立即進行更新數據,未來隨時都可以進來調整。
  8. 如果還想將工作簿分享給其他人或嵌入自己的Blog/網站,可以在視圖右下方取得直接鏈結與嵌入代碼。
    以以上是這次的分享囉! 我自己做的視圖可以在下方查看~


    留言

    這個網誌中的熱門文章

    [HowTo] 怎樣才能畫出環圈圖(甜甜圈)

    首先呢,要有個圓餅圖(Pie Chart) 接下來,在Rows上以滑鼠左鍵雙擊輸入數字"0",輸入後Tableau會建立一個SUM(0)

    [HowTo] 地址批次轉換為經緯度

    兩個我知道可以批次轉換地址為經緯度的網站 Batch Geocoding 這網站是透過 Google Map API, 因為非商用 google 是有限制的。 實際再用時當一次轉換筆數過多時中間容易會有失敗的現象 , 筆數越多失敗率越高

    [HowTo] 用Tableau來繪製雷達圖

    雷達圖 (Radar Chart) 經常被使用在需要同時評估多重指標時,例如戰力圖、財務狀態綜合指標、品質管制分析、員工能力分析等等 在 Tableau 最簡單要繪製雷達圖的方式是先將相關指標值轉換為 (x 、 y) 座標標示,在 Tableau 利用 polygon 將指標依序連接起來,最後放上一個雷達圖的底圖。

    [HowTo] 關於排序的幾種方式 - 參數控制

    排序 (sorting) 在做數據分析時經常會被使用。 在 Tableau 的設計中,簡單的排序只要畫面上點選就可以做到。 但有時候,設計者希望能透過參數的選擇方式,讓閱讀者能夠點選或切換排序依據。 這時候就需要一些稍微進階的作法。 這篇會說明透過參數與計算字段方式來產生動態的排序。 (update at 2020/04/24) 範例一 :  顯示各年度次類別的銷售,並可選擇依據哪個年度排序,且選擇遞增或遞減排列 如何做呢 ? 建立兩個參數,一個是年度,另一個是昇降冪 建立計算字段 計算字段如下,主要是透過一個邏輯判斷僅保留下參數選定的年度的Sales,然後乘上參數(+1/-1)來改變排序方向 最後在 Sub-Category 的排序中選擇以剛剛的計算字段作為排序依據 完成後如下 : 範例二 : 主要維度需要可以選擇 ( 次分類、洲或者區域與產品分組 ) 顯示銷售、利潤與毛利率,並可依據其中一項度量作為排序依據且選擇遞增或遞減排列。 如何做呢 ? 分別建立主欄位、度量、昇降冪的參數 建立計算字段  A.  建立維度的選擇計算字段如下 建立排序用的計算字段B,透過邏輯判斷先選擇度量的參數, 然後乘上參數(+1/-1)來改變排序方向 最後在前面創建的主欄位選擇維度(A)的排序中選擇剛剛的計算字段B 完成後如下 :

    [HowTo] 用甜甜圈來呈現目標達成率

    如何用環狀圖(甜甜圈)來呈現如下圖的單一個目標達成率的數字呢? 其實方法就是,用兩個數字XDDDD 如果你的數據跟我的Sample一樣已經有目標值(Goal) & 實際值(Sales),就要先算出與目標值的差距數值 如果你的數據已經是達成率,那就做一個 1-[達成率] 的計算字段來代替 接下來一樣是先選擇做一個Pie Chart, 但這時候是將Measure Names放到Color,然後將Measure Values 放到Angle Measure Values 只保留SUM(Sales) & SUM(Gap to Goal)兩項 再來就可以透過前一篇提到的甜甜圈作法,用雙軸的方式產生出一個小圓覆蓋在Pie Chart上面 最後調整顏色 & 格式 &文字,然後需要的話可以將數值顯示在中間 那整個完成後的視圖如下: