全球最大開(kāi)源地理大模型來(lái)啦!IBM、美國(guó)航天局權(quán)威出品
專(zhuān)注AIGC領(lǐng)域的專(zhuān)業(yè)社區(qū),關(guān)注OpenAI、百度文心一言等大語(yǔ)言模型(LLM)的發(fā)展和應(yīng)用落地,關(guān)注LLM的基準(zhǔn)評(píng)測(cè)和市場(chǎng)研究,歡迎關(guān)注!
IBM、NASA(美國(guó)國(guó)家航空航天局)同時(shí)在官網(wǎng)宣布,在Hugging Face上開(kāi)源全球最大的地理空間大模型——Prithvi。
據(jù)悉,Prithvi由NASA提供大量地理、氣候、災(zāi)害等衛(wèi)星遙感數(shù)據(jù),在IBM的watsonx.ai模型上預(yù)訓(xùn)練、微調(diào)而成。Prithvi主要用于預(yù)測(cè)氣候變化、洪水映射、跟蹤森林砍伐、預(yù)測(cè)作物產(chǎn)量等。
Prithvi共包括Prithvi-100M (基礎(chǔ)模型),Prithvi-100M-sen1floods11(洪水映射模型),Prithvi-100M-multi-temporal-crop-classification(作物、土地識(shí)別模型),Prithvi-100M-burn-scar(火災(zāi)傷痕識(shí)別模型)四大塊組成。
值得一提的是,NASA還將作物分類(lèi)、火災(zāi)傷痕的衛(wèi)星訓(xùn)練數(shù)據(jù)集進(jìn)行了開(kāi)源,方便科學(xué)機(jī)構(gòu)、企業(yè)用于地理空間大模型的訓(xùn)練和技術(shù)研究。
基礎(chǔ)模型開(kāi)源地址:https://huggingface.co/ibm-nasa-geospatial/Prithvi-100M
洪水模型:https://huggingface.co/ibm-nasa-geospatial/Prithvi-100M-sen1floods11
作物、土地分類(lèi)模型:https://huggingface.co/ibm-nasa-geospatial/Prithvi-100M-multi-temporal-crop-classification
火災(zāi)傷痕識(shí)別模型:https://huggingface.co/ibm-nasa-geospatial/Prithvi-100M-burn-scar
NASA官宣
IBM官宣
NASA表示,獲取最新數(shù)據(jù)仍然是氣候科學(xué)的一個(gè)重大挑戰(zhàn),因?yàn)?span style="font-family: 微軟雅黑, sans-serif;font-size: 15px;letter-spacing: 1px;text-wrap: wrap;">氣候環(huán)境幾乎每時(shí)每刻都在發(fā)生復(fù)雜的變化。預(yù)計(jì)到2024年,科學(xué)家們將從氣候等場(chǎng)景中獲得25萬(wàn)TB的數(shù)據(jù),如何高效分析、使用這些數(shù)據(jù)非常有挑戰(zhàn)性。
現(xiàn)在,借助NASA和IBM開(kāi)源的地理空間大模型,可以推動(dòng)地理、氣候、作物等數(shù)據(jù)分析平民化,以加速技術(shù)創(chuàng)新。
NASA開(kāi)源Harmonized Landsat Sentinel-2衛(wèi)星數(shù)據(jù)
除了IBM的watsonx.ai模型,NASA提供的Harmonized Landsat Sentinel-2(簡(jiǎn)稱(chēng)“HLS”)數(shù)據(jù)集,對(duì)于打造功能強(qiáng)大、高精準(zhǔn)的Prithvi大模型至關(guān)重要,因?yàn)檫@些都是衛(wèi)星提供的監(jiān)測(cè)數(shù)據(jù),平常機(jī)構(gòu)、企業(yè)很難獲取。
根據(jù)NASA的介紹,HLS的數(shù)據(jù)來(lái)自NASA、USGS(美國(guó)地質(zhì)勘探局)、陸地衛(wèi)星8、9號(hào),以及歐盟哥白尼哨兵-2A和哨兵-2B的衛(wèi)星監(jiān)控?cái)?shù)據(jù)。

2023年7月11日獲得的冰島西北部的真彩HLS圖像
這些數(shù)據(jù)能以30米的空間分辨率,每2—3天對(duì)全球陸地進(jìn)行一次觀測(cè)。該數(shù)據(jù)可用于洪水映射、作物/土地識(shí)別、氣候預(yù)測(cè)、火災(zāi)傷痕識(shí)別等。ASA將作物分類(lèi)、火災(zāi)傷痕的訓(xùn)練數(shù)據(jù)集進(jìn)行了開(kāi)源。
其中,作物分類(lèi)數(shù)據(jù)集包含2022年美國(guó)大陸,不同土地覆蓋和作物類(lèi)別的Landsat-Sentinel圖像,例如,玉米、大豆、小麥等。數(shù)據(jù)標(biāo)簽來(lái)自美國(guó)農(nóng)業(yè)部的作物數(shù)據(jù)層(CDL),主要用于訓(xùn)練分割地理空間的機(jī)器學(xué)習(xí)模型。
作物分類(lèi)數(shù)據(jù)集開(kāi)源地址:https://huggingface.co/datasets/ibm-nasa-geospatial/multi-temporal-crop-classification

火災(zāi)傷痕數(shù)據(jù)集包含2018-2021年美國(guó)本土火災(zāi)疤痕和相關(guān)的Landsat和Sentinel-2圖像。共有804個(gè)512 x512場(chǎng)景,也是用于訓(xùn)練地理空間機(jī)器學(xué)習(xí)模型。
火災(zāi)傷痕數(shù)據(jù)開(kāi)源地址:https://huggingface.co/datasets/ibm-nasa-geospatial/hls_burn_scars
Prithvi功能展示
NASA和IBM展示了Prithvi模型強(qiáng)大的識(shí)別、分類(lèi)功能。以多作物識(shí)別為例,上傳一個(gè)Geotiff格式的衛(wèi)星圖片,Prithvi可快速識(shí)別出圖中的森林、冬小麥、濕地、高粱、荒地等屬性。
案例展示
多作物識(shí)別在線測(cè)試地址:https://huggingface.co/spaces/ibm-nasa-geospatial/Prithvi-100M-multi-temporal-crop-classification-demo
洪水映射識(shí)別,上傳一張Sentinel 2衛(wèi)星圖片,可識(shí)別出洪水的區(qū)域(黑色土地,白色水域)。

洪水映射識(shí)別體驗(yàn)地址:https://huggingface.co/spaces/ibm-nasa-geospatial/Prithvi-100M-sen1floods11-demo
火災(zāi)痕跡識(shí)別,上傳一張Geotiff衛(wèi)星圖片,可識(shí)別出發(fā)生過(guò)火災(zāi)的土地(黑色,無(wú)燒傷土地,白色發(fā)生過(guò)火災(zāi)土地)。

火災(zāi)痕跡識(shí)別體驗(yàn)地址:https://huggingface.co/spaces/ibm-nasa-geospatial/Prithvi-100M-Burn-scars-demo
關(guān)于NASA
NASA創(chuàng)立于1958年,主要負(fù)責(zé)美國(guó)的民用航空和宇宙計(jì)劃。NASA的研究領(lǐng)域包括航天工程、地球科學(xué)、天體物理學(xué)和宇宙生物學(xué)等。
NASA最為人所知的項(xiàng)目是“阿波羅計(jì)劃”,該計(jì)劃在1969年使人類(lèi)首次登上月球。此外,NASA還負(fù)責(zé)了許多其他重要的航天項(xiàng)目,包括洛杉磯號(hào)航天飛機(jī)、火星探測(cè)器好奇號(hào)和毅力號(hào),以及哈勃太空望遠(yuǎn)鏡等。
本文素材來(lái)源NASA、IBM官網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系刪除
END
