比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

金融圈注意了 BloombergGPT來了_BLO

Author:

Time:1900/1/1 0:00:00

ChatGPT引爆的AI熱潮也“燒到了”金融圈,彭博社重磅發布為金融界打造的大型語言模型(LLM)——BloombergGPT。

3月30日,根據彭博社最新發布的報告顯示,其構建迄今為止最大的特定領域數據集,并訓練了專門用于金融領域的LLM,開發了擁有500億參數的語言模型——BloombergGPT。

報告顯示,該模型依托彭博社的大量金融數據源,構建了一個3630億個標簽的數據集,支持金融行業內的各類任務。該模型在金融任務上的表現遠超過現有模型,且在通用場景上的表現與現有模型也能一較高下。

一般來說,在NLP領域,參數數量和復雜程度之間具有正相關性,GPT-3.5模型的參數量為2000億,GPT-3的參數量為1750億。

法國央行行長:不允許下一個加密寒冬仍存在金融不穩定性:11月15日消息,由于FTX破產事件,法國央行行長Francois Villeroy de Galhau在東京的一次演講中呼吁全球合作監管,以應對加密市場造成的金融不確定性,他說道:我要強調,這種不確定性是我們需要在國際上對加密資產進行強有力和快速監管的原因,我們不能允許下一個加密寒冬仍存在金融不確定性和不穩定性。[2022/11/15 13:08:22]

關于BloombergGPT

報告指出,研究人員利用彭博社現有的數據,對資源進行創建、收集和整理,通過構建迄今為止最大的特定領域數據集來完成BloomberGPT,并基于通用和金融業務的場景進行混合模型訓練:

彭博社主要是一家金融數據公司,數據分析師在公司成立的四十年的時間里收集了大量的金融文件,擁有廣泛的金融數據檔案,涵蓋了一系列的主題。

貝寶金融向新加坡金融管理局申請相關執照,進入新加坡加密市場:加密金融服務商貝寶金融(Babel Finance)已向新加坡金融管理局申請相關執照,計劃在本季度投入運營,初步計劃聘請五至十人。公司目前提供基于比特幣、以太坊和穩定幣等加密資產的借貸、加密資產管理以及經紀等服務。貝寶金融聯合創始人王立表示,加密貨幣風險較高,公司主要面對機構投資者和合格投資者,不做散戶投資者的生意。

據此前報道,貝寶金融于今年5月完成4000萬美元A輪戰略融資,萬物資本、紅杉資本中國基金、Dragonfly Capital、BAI資本以及老虎環球基金(Tiger Global Management)參投。(聯合早報)[2021/7/26 1:15:32]

我們將這些數據添加到公共數據集中,以創建一個擁有超過7000億個標簽的大型訓練語料庫。

使用這個訓練語料庫的一部分,我們訓練了一個具有彭博風格的,達500億參數的模型,該模型是根據Hoffmann和Le Scao等人的指導方針設計,基于通用和金融業務的場景進行混合模型訓練。

聲音 | 海南副省長:海南已搭建智慧金融平臺加快推進數字資產交易和金融科技監管:此前,南國際離岸創新創業(三亞)試驗區正式揭牌。海南省副省長王路表示,海南目前已在省內掛牌數個創新創業基地,引進相關企業30多家,與以色列等20多個國家和地區開展了合作;此外,試驗區與歐科集團等區塊鏈企業簽署戰略合作協議,能有效助推區塊鏈技術在海南創新發展。而海南此前設立的國內首個區塊鏈產業試驗區同樣吸引了360、迅雷區塊鏈等多家企業入駐。在數字資產交易和金融科技監管方面,海南省已搭建智慧金融平臺加快推進,力求將海南打造成國家區塊鏈研究應用示范中心和國家數字資產交易示范區。(經濟參考網)[2019/12/4]

結果表明,我們的混合訓練方法使我們的模型在金融任務上的表現大大超過了現有的模型,而在通用場景上的表現則與之相當甚至優于現有模型。

現場 | 吳杰莊:香港是結合創科和金融的理想地方 ?:金色財經11月27現場報道,今日首屆B2 FinTech科技金融全球峰會暨頒獎盛典在香港舉行。高峰集團董事局主席吳杰莊現場指出,對香港來說,金融肯定是應用創科成果的重要產業。香港是國際金融中心,同時擁有高度發達的資訊及通訊科技產業,是結合創科和金融的理想地方。香港金融管理局進行了科技監管沙盒,證券及期貨事務監察委員會也在探索虛擬資產交易平臺的合規監管。香港對區塊鏈整體是開放的態度,事實上,在區塊鏈、移動支付、網絡安全、人工智能、大數據等應用研發方面均有發展。[2018/11/27]

1.BloombergGPT優勢:特定領域模型仍有其不可替代性且彭博數據來源可靠

在論文中,彭博社指出,現階段,通用的自然語言處理模型可以涵蓋許多領域,但針對特定領域模型仍有其不可替代性,因彭博社的大多數應用均為金融領域,著手構建了一個針對金融領域的模型尤其優勢,同時可以在通用LLM基準測試上保持競爭力:

動態 | 印度政府正在考慮為該國金融交易啟動加密令牌:據dnaindia消息,有消息人士稱,即使現有的數字貨幣禁令可能還會繼續存在,但印度政府正在考慮為該國的金融交易啟動加密令牌。研究數字資產使用的委員會正在制定一系列法規和具體行動,包括未來允許數字貨幣的路線圖。該消息人士稱,一旦法規草案準備好并經過法律審查,便會提交議會審議。該委員會的經濟事務部秘書Subhash Chandra Garg表示:“雖然貨幣被完全禁止,但委員會正在討論其他用途,以及如何將其納入印度主流。”專家認為,印度政府不太可能在短期內改變其對數字貨幣的立場,但可能允許數字代幣進行試水。該委員會還將給出允許數字貨幣的前因和后果。[2018/8/10]

除了構建金融領域的LLM外,本文的經驗也為其他研究領域的專用模型提供了參考。我們的方法是在特定領域和一般數據源上訓練LLM,以開發在特定領域和通用基準上表現優異的模型。

此外,我們的訓練數據不同于傳統的網絡爬取數據,網絡上的數據總有重復和錯誤,但我們的數據來源可靠。

2.BloombergGPT的訓練數據集:

BloombergGPT的訓練數據庫名為FINPILE,由一系列英文金融信息組成,包括新聞、文件、新聞稿、網絡爬取的金融文件以及提取到的社交媒體消息。

為了提高數據質量,FINPILE數據集也使用了公共數據集,例如The Pile、C4和Wikipedia。FINPILE的訓練數據集中大約一半是特定領域的文本,一半是通用文本。為了提高數據質量,每個數據集都進行了去重處理。

對金融領域的理解更準

報告指出,在金融領域中的自然語言處理在通用模型中也很常見,但是,針對金融領域,這些任務執行時將面臨挑戰:

以情感分析為例,一個題為“某公司將裁員1萬人”,在一般意義上表達了負面情感,但在金融情感方面,它有時可能被認為是積極的,因為它可能導致公司的股價或投資者信心增加。

報告指出,從測試來看,BloombergGPT在五項任務中的四項(ConvFinQA,FiQA SA,FPB和Headline)表現最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT有其優勢性。

測試一:ConvFinQA數據集是一個針對金融領域的問答數據集,包括從新聞文章中提取出的問題和答案,旨在測試模型對金融領域相關問題的理解和推理能力。

測試二:FiQA SA,第二個情感分析任務,測試英語金融新聞和社交媒體標題中的情感走向。

測試三:標題,數據集包括關于黃金商品領域的英文新聞標題,標注了不同的子集。任務是判斷新聞標題是否包含特定信息,例如價格上漲或價格下跌等。

測試四:FPB,金融短語庫數據集包括來自金融新聞的句子情緒分類任務。

測試五:NER,命名實體識別任務,針對從提交給SEC的金融協議中收集金融數據,進行信用風險評估。

對于ConvFinQA來說,這個差距尤為顯著,因為它需要使用對話式輸入來對表格進行推理并生成答案,具有一定挑戰性。

ChatGPT為彭博點贊

華爾街見聞就這個問題專門詢問了ChatGPT,ChatGPT認為BloombergGPT是一項很有意義的技術進步:

它是專門為金融領域開發的一種語言模型,可以更好地處理金融領域的數據和任務,并且在金融領域的基準測試中表現出色。

這將有助于金融從業者更好地理解和應用自然語言處理技術,促進金融科技的發展。同時,BloombergGPT還可以為其他領域的語言模型的發展提供參考和借鑒。總的來說,BloombergGPT是一個有益的技術創新。

華爾街見聞

媒體專欄

閱讀更多

金色財經 善歐巴

金色早8點

白話區塊鏈

歐科云鏈

Odaily星球日報

Arcane Labs

MarsBit

深潮TechFlow

BTCStudy

鏈得得

Tags:GPTERGBERBLOAIGPT價格CryptoEnergycyberveinblockchainapp

比特幣行情
疑與龐氏騙局One Coin有關 DWF Labs大起底_ETHE

文/@nay gmy,譯/金色財經xiaozouDWF Labs究竟是何方神圣?過去的幾個月里,他們的身影無處不在,向所有人拋灑支票,從合法項目到死亡項目.

1900/1/1 0:00:00
以技術見長的Sui 能成為MOVE系新公鏈“話事人”嗎?_APT

原文:《加速發展的Sui,能否成為下一個Layer1破局者》作者:Daniel LiSui正在從幕后走向前臺,向人們展示多年來積累的技術實力.

1900/1/1 0:00:00
以太坊再質押協議EigenLayer測試網交互教程_ETH

編輯:Bowen@Web3CN.ProEigenLayer發布第一階段測試網4月7日消息,以太坊再質押協議EigenLayer在博客文章中宣布,其已發布EigenLayer協議第一階段測試網.

1900/1/1 0:00:00
一文盤點6個基于zkSync的創新項目_KSY

原文作者:The DeFi Investor當下,zkSync 生態系統正準備迎來爆發式增長,而現在正是加入的最佳時機.

1900/1/1 0:00:00
ChatGPT與教育的未來_HAI

作者:王鵬 騰訊研究院資深專家ChatGPT火爆以來,其對教育理念和方式的沖擊引起廣泛討論,似乎也讓人看到了人工智能影響下未來教育的一些走向.

1900/1/1 0:00:00
體育與元宇宙:一場包容性的變革_PORT

最近,當我在舊金山經過7天的艱苦騎行活動后,在圣地亞哥與眾多有身體缺陷的自行車手一起沖過年度籌款活動的終點線時,我見證了體育作為生活的包容性象征的力量.

1900/1/1 0:00:00
ads