所以,為什麼要開放資料呢?🤔
盡可能地分享研究數據,是近十年才出現的觀念,科學家逐漸發現,大量的資料有其不同研究與應用的潛力,因此開始提倡資料開放。在傳統認知上,則剛好相反,為了預防自己努力的研究成果被別人瞟竊,並不會隨意公開詳細的研究資料(尤其原始資料)。
然而時間一久,資料因各種因素消失的可能性就越高,像是硬碟損毀、僅留在某人的個人電腦、人員失聯等等。試想一下,這些研究資料的取得往往耗費了大量人力、物力、財力,然而在傳統學術論文中,這些資料通常僅部分提供或經過轉譯/分析並作為附件,甚至沒有再次被使用的機會,最終被淹沒在個人電腦的資料汪洋中或消失不見🫠。
要瞭解資料開放的等級跟原則,我們可以用一張有座標點位、日期、物種的生態照片的例子來解釋。想像你是一個小小的生態探險家,你喜歡探索大自然並記錄下你所看到的一切。今天你在森林中拍到了一張生態照片,上面有很多動物🦝和植物🌿。
現在讓我們來看看資料開放的原則:
✅ 找得到(Findable)
找得到,就是可被搜尋,資料有標籤或辨識號。 就像是你把照片上傳到一個網站,讓其他人可以看到這張照片,能欣賞到你拍攝的照片。
✅ 拿得到(Accessible)
當其他人找到所需的資料後,需要知道如何存取這些資料以及相關的授權,資料盡可能提供網路下載,同時提供的資料格式是適用和可被修改的。 想像你是一個 #熱血中年人,有緣參與一個 #生態調查計畫,收集了不同物種在某個自然保護區的觀察資料,包含了物種名稱、觀察日期、觀察地點和每個物種的數量、動物行為等等。你希望這些資料進一步分析、統計並與其他研究者共享。
👉/Excel vs. PDF/
如果你分享的資料為 Excel 檔,別人可使用 Excel 提供的各種功能進行資料整理和分析。並可根據不同的物種、觀察日期或地點,輕鬆地進行排序、篩選和計算。 這些操作對其他使用者來說非常有用,可以研究物種的分佈模式和族群變化。相比之下,PDF 格式的文件雖然保留了原始格式和佈局,但並無法像 Excel 那樣方便地操作和提取數據資料。
👉/Excel vs. 文字檔案/
如果你將觀察數據保存為文字檔案(如 CSV、TXT 或 TSV),這些檔案只包含純文字和數字,沒有複雜的格式和公式。而文字檔案具有以下優點: 研究人員可以使用各種程式語言(如 Python、R)或統計軟體(如 SPSS、SAS)輕鬆讀取和解析這些檔案。 文字檔案通常體積較小,節省存儲空間,並且在數據共享和傳輸方面更具便利性。且跨平台相容性強,可在不同操作系統和軟體中使用,不需要擔心版本兼容性問題。👍👍👍
總結起來,如果你希望資料能夠輕鬆地進行整理、分析和與其他人共享, Excel 較PDF適合。如果你只需要純文字數據,且希望資料能夠在不同系統中輕鬆使用,那麼文字檔案(如 CSV、TXT 或 TSV)是更好的選擇。
✅ 可互用(Interoperable)
你的紀錄中其實隱含了許多資訊,就像你在觀察時標註了不同物種的名字跟數量,以及不同的位置,這樣其他人就可以輕鬆看懂你的資料,了解森林中有哪些有趣的生物。 也因此,別人若要可以下載使用,資料的說明和格式應有統一的資料標準,同時提供的檔案格式必須是可被修改並再次編輯的。
✅ 可重新應用(Reusable)
允許任何人將資料重新應用,並提供授權聲明(Data License),讓其他人知道怎麼在法律允許的範圍內適當地使用你的資料。 這就像是你告訴其他人,在引用並標示作者姓名的前提下,他們可以使用這張照片中的點位和數量紀錄進行研究或教育活動,舉例來說,可以在學校報告中使用這些數據、或者將這些紀錄分享給其他的生態學家和學生,促進更多的學習和研究。
總之,資料開放的原則就像是你在分享生態照片和數量紀錄時所遵循的規則,確保別人可以自由存取、容易閱讀、可再使用和分享、檔案能夠在不同程式中打開,並且是準確可靠的。這樣其他人就可以和你一起探索自然的奧秘,並進行多元的學習和研究。
資料開放帶來新的可能,大數據的世界,與他人共享資料,除了讓辛苦調查所得的資料發揮更大的研究價值,還能增加研究的時空尺度,了解生物多樣性的整體樣貌,甚至發展出新的研究課題,擴展研究的深度與廣度🌏。