Menu

  • Home
  • Trending
  • Recommended
  • Latest

分類

  • #2021 新年特輯
  • 100天區塊鏈挑戰
  • 2019 台灣區塊鏈產業指南
  • 2020 台灣區塊鏈產業年鑑
  • 2022 台灣年度最影響力人物榜
  • 2023 台灣年度影響力人物榜
  • 2023 新春特輯
  • 2024 TON Hacker House
  • 2024新春特輯
  • ABS 2018 專題報導
  • AI
  • CBDC是什麼?為何全球都在積極研究、有什麼優點與隱憂
  • Cefi
  • dao
  • dApps
  • defi
  • DePIN 如何開啟去中心化物理網路革命?
  • Entertainment
  • EOS
  • EOS insights
  • Gaming
  • Howto & Style
  • ICO
  • JiaJia
  • Layer 2
  • Libra
  • Movie
  • Music
  • News
  • nft
  • Plurality 多元宇宙
  • Starknet 空投落地,後續帶來什麼影響?
  • TON的崛起之路》背靠 Telegram 如何實現 Web3 大規模應用?
  • Uncategorized
  • Web3.0
  • 中國
  • 亞太
  • 交易所
  • 人物專訪
  • 以太坊
  • 以太坊
  • 以太坊 Dencun 坎昆升級將臨,你需要知道的所有事
  • 以太坊再質押協議為何成為最熱門賽道?
  • 供應鏈
  • 保險
  • 債券
  • 元宇宙
  • 全台最大詐騙案!Ace交易所涉垃圾幣詐騙
  • 全球加密貨幣監管最新動態統整
  • 其他國家
  • 其他幣別
  • 分散式帳本技術
  • 創投
  • 加密貨幣「詐騙手法」整理,學習如何保護你的資產
  • 加密貨幣市場
  • 區塊鏈平台
  • 區塊鏈新手全攻略,你需要知道的加密貨幣基礎
  • 區塊鏈新手教學
  • 區塊鏈活動
  • 區鍵禧
  • 即時新聞
  • 台灣
  • 哈希派
  • 國際組織報告
  • 多元宇宙Plurality有多重要?未來20年人類躍進關鍵
  • 央行
  • 娛樂平台
  • 安全
  • 專欄作者
  • 巴拉區塊事
  • 市場分析
  • 幣安與美國司法部達成 43 億美元和解,CZ認罪
  • 影片測試的分類
  • 快訊
  • 技術
  • 抓住空投爆擊!值得埋伏的項目、互動教學總整理
  • 投資分析
  • 挖礦
  • 推薦閱讀
  • 搶先看
  • 支付
  • 政府報告
  • 數位產權
  • 數據報告
  • 概念
  • 歐洲
  • 比特幣
  • 比特幣現貨ETF上市,真帶來了增量資金?
  • 比特幣第四次減半將臨,行情怎麼走?
  • 比特幣銘文大爆發,Oridinal 如何改變 BTC 生態?
  • 比特彭
  • 汪彪
  • 法規
  • 測試網
  • 灰度
  • 物聯網
  • 犯罪
  • 獨立觀點
  • 瑞波
  • 環境永續
  • 社交
  • 私人機構報告
  • 稅務
  • 穩定幣
  • 管制
  • 美國
  • 肺炎
  • 能源
  • 訴訟
  • 評級報告
  • 財金哥 & 區塊妹
  • 身份驗證
  • 遊戲
  • 鄧庶杭
  • 金融市場
  • 銀行
  • 錢包

Subscriptions

  • 零壹財經 01 binary
    01 Binary
  • 0xdt
  • 0xJigglypuff
  • aaaaYYYY
  • ABCDELabs

Recent News

  • 圖解多元宇宙》V神、Glen力推的Plurality是什麼?為何協作技術是人類社會進步關鍵
  • 精選文章搶先看!動區登入Access質押訂閱服務,解鎖寶貴資訊快人一步
  • ABS獨家專訪》Gitcoin共同創辦人Scott:台灣是現實與Web3治理的重要交匯點
動區動趨-最具影響力的區塊鏈新聞媒體
  • Home
    • Home Layout 1
    • Home Layout 2
    • Home Layout 3
  • Browse
    • News
    • Movie
    • Music
    • Technology
    • Howto & Style
    • Entertainment
    • Gaming
  • Features
    • Youtube Video
    • Vimeo Video
    • Dailymotion Video
    • Self-hosted Video
    • User Profile
    • Playlists
    • User-created Playlist
    • Favorite Playlist (Private)
    • Watch Later Playlist (Private)
    • All JNews Features
No Result
View All Result
  • Login
  • Register
UPLOAD
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home AI

Meta再推AI神器,開源免費的模型Code Llama,對比ChatGPT如何?

Foresight News by Foresight News
2023-08-29
in AI
1.4k 71
0
Meta再推AI神器,開源免費的模型Code Llama,對比ChatGPT如何?
2k
SHARES
8.9k
VIEWS
Share on FacebookShare on Twitter

Meta 近日釋出了一個基於 Llama 2 進行微調構建的大型語言模型 Code Llama。
(前情提要:ChatGPT企業版上線!OpenAI客製模型、共享對話… 六大功能一次看 )
(背景補充:AI辦案!台灣檢警靠「ChatGPT」破獲1.5億虛擬貨幣詐騙案 )

本文目錄

  • RelatedPosts
  • Reddit宣布深度合作OpenAI:提供內容給ChatGPT、新增AI工具..重新推出代幣獎勵制度
  • V 神:GPT-4已通過圖靈測試,研究顯示人類有56%機率誤認GPT-4為人類
  • Google強打OpenAI:Gemini Live和GPT-4o誰能更勝一籌?
  • Code Llama 的工作原理
  • Code Llama 的效能如何?
  • 實際使用對比 ChatGPT vs. Code Llama

 

RelatedPosts

Reddit宣布深度合作OpenAI:提供內容給ChatGPT、新增AI工具..重新推出代幣獎勵制度

V 神:GPT-4已通過圖靈測試,研究顯示人類有56%機率誤認GPT-4為人類

Google強打OpenAI:Gemini Live和GPT-4o誰能更勝一籌?

Meta 近日釋出了一個基於 Llama 2 進行微調構建的大型語言模型 Code Llama,可以使用文字提示生成程式碼,並且開源,可供研究和商業用途。

Code Llama 是針對程式碼任務的公開 LLM 的最先進技術,有可能使當前開發人員的工作流程更快、更高效,並降低學習編碼人員的進入門檻。 Code Llama 有潛力用作生產力和教育工具,幫助程式員編寫更強大、文件更齊全的軟體。

Code Llama 的工作原理

今年 7 月,Meta(原 Facebook)釋出了免費可商用的開源大模型 Llama 2。最新發布的 Code Llama 是 Llama2 的專門用於編碼的專用版本,是通過在其特定於程式碼的資料集上進一步訓練 Llama 2 來建立的,從同一資料集中取樣更多資料的時間更長。

總的來說,Code Llama 具有增強的編碼功能,建立在 Llama 2 之上。它可以根據程式碼和自然語言提示生成程式碼和有關程式碼的自然語言(例如,「給我寫一個輸出斐波那契序列的函式。」) 它還可用於程式碼完成和除錯。

Code Llama 支援當今使用的許多最流行的語言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Code Llama 目前擁有三個引數版本: 70 億引數、130 億引數、340 億引數 。

每個版本都使用 500B 程式碼 token 和程式碼相關資料進行訓練。 70 億 和 130 億引數基礎模型和指令模型也經過了中間填充 (FIM) 功能的訓練,允許它們將程式碼插入到現有程式碼中,這意味著它們可以支援開箱即用的程式碼完成等任務。

這三種模型滿足不同的服務和延遲要求。 例如,70 億模型可以在單個 GPU 上執行。 340 億模型返回最佳結果並提供更好的編碼輔助,但較小的 70 億和 130 億模型速度更快,更適合需要低延遲的任務,例如即時程式碼完成。Code Llama 模型提供了具有多達 10 萬個上下文 token 的穩定生成。 所有模型都在 16,000 個 token 的序列上進行訓練,並在最多 100,000 個 token 的輸入上顯示出改進。

除了是生成更長程式的先決條件之外,擁有更長的輸入序列還可以為程式碼法學碩士解鎖令人興奮的新用例。 例如,使用者可以為模型提供來自其程式碼庫的更多上下文,以使各代更相關。 它還有助於除錯較大程式碼庫中的場景,在這種情況下,掌握與具體問題相關的所有程式碼對於開發人員來說可能具有挑戰性。 當開發人員面臨除錯大量程式碼時,他們可以將整個程式碼長度傳遞到模型中。

Meta 還微調了 Code Llama 的兩個附加版本: Code Llama – Python  和  Code Llama – Instruct 。

  • Code Llama – Python 是 Code Llama 的語言專用變體,在 Python 程式碼的 100B token 上進一步微調。
  • Code Llama – Instruct 是 Code Llama 的指令微調和對齊版本。 指令調整繼續訓練過程,但目標不同。 該模型接受「自然語言指令」輸入和預期輸出。 這使得它能夠更好地理解人們對提示的期望。 我們建議在使用 Code Llama 進行程式碼生成時使用 Code Llama – Instruct 版本,因為 Code Llama – Instruct 已經過微調,可以用自然語言生成有用且安全的答案。

但是不建議使用 Code Llama 或 Code Llama – Python 執行一般自然語言任務,因為這兩個模型都不是為遵循自然語言指令而設計的。 Code Llama 專門用於特定於程式碼的任務,不適合作為其他任務的基礎模型。

Code Llama 的效能如何?

HumanEval 和 Mostly Basic Python 程式設計 (MBPP) 是兩個常用編碼能力測試基準 —— HumanEval 用於測試模型根據文件字串完成程式碼的能力,MBPP 用於測試模型根據描述編寫程式碼的能力。

根據這兩個測試基準對 Code Llama 測試顯示,Code Llama 優於開源、特定程式碼的 Llama,並且優於 Llama 2 本身。例如,Code Llama 34B 在 HumanEval 上得分為 53.7%,在 MBPP 上得分為 56.2%,超越了 ChatGPT,但在 HumanEval 上仍遜於 GPT-4。

圖表來源:Meta CodeLlama-34B 的微調模型已超過 GPT-4?

 

雖然 Code Llama 並未在測試中一騎絕塵,但這並不是 Code Llama 的全部,其另一個亮點就是再次微調。使用者可以通過對開源的 Code Llama 進行再次微調,構建出符合自己的需求的最佳版本。

Phind 最近根據自己的資料集上對 CodeLlama-34B 和 CodeLlama-34B-Python 進行了微調,其微調版本在 HumanEval 上分別實現了 67.6% 和 69.5% 的成績,這超過了 OpenAI 3 月份公佈的 GPT-4 的 67%。

相關連結:https://www.phind.com/blog/code-llama-beats-gpt4

實際使用對比 ChatGPT vs. Code Llama

首先,這次對比中使用了 GPT-3.5 版本的 ChatGPT,以及 Perplexity 平臺支援的 Code Llama。我們將提出 8 個問題,以此來對比二者是否成功生成程式碼。

問題 1: 使用 Python。 給定兩個字串 word1 和 word2。 通過以交替順序新增字母來合併字串,從 word1 開始。 如果一個字串比另一個字串長,請將附加字母附加到合併字串的末尾。

返回合併後的字串。

示例 1:

  • 輸入:word1 =「abc」,word2 =「pqr」
  • 輸出:「apbqcr」

🟢 ChatGPT:成功 +1

🔵 Code Llama:成功 +1

問題 2: 使用 Python。 給定一個字串 s,僅反轉字串中的所有母音並返回它。

母音為 「a」、「e」、「i」、「o」 和 「u」,它們可以以小寫和大寫形式出現多次。

示例 1:

  • 輸入:s =「你好」
  • 輸出:「霍爾」

🟢 ChatGPT:成功 +1

🔵 Code Llama:失敗 +0

問題 3: 使用 Python。 給定一個整數陣列 nums,將所有 0 移至其末尾,同時保持非零元素的相對順序。

請注意,您必須就地執行此操作,而不製作陣列的副本。

示例 1:

  • 輸入:nums = [0,1,0,3,12]
  • 輸出:[1,3,12,0,0]」

🟢 ChatGPT:成功 +1

🔵 Code Llama:失敗 +0

問題 4: 使用 Python。 你有一個長長的花壇,其中有些地塊種植了,有些則沒有。 但是,相鄰的地塊不能種植花卉。

給定一個包含 0 和 1 的整數陣列花壇,其中 0 表示空,1 表示非空,以及一個整數 n,如果可以在花壇中種植 n 朵新花而不違反無相鄰花規則,則返回 true,否則返回 false。

示例 1:

  • 輸入:花壇 = [1,0,0,0,1], n = 1
  • 輸出:true

示例 2:

  • 輸入:花壇 = [1,0,0,0,1], n = 2
  • 輸出:false

🟢 ChatGPT:成功 +1

🔵 Code Llama:成功 +1

問題 5: 使用 Python。 給定一個輸入字串 s,反轉單詞的順序。

單詞被定義為非空格字元的序列。 s 中的單詞將至少由一個空格分隔。

返回由單個空格按相反順序連線的單詞字串。

請注意,s 可能在兩個單詞之間包含前導或尾隨空格或多個空格。 返回的字串應該只有一個空格來分隔單詞。 請勿包含任何額外空格。

示例 1:

  • 輸入:s =「天空是藍色的」
  • 輸出:「藍色是天空」」

🟢 ChatGPT:成功 +1

🔵 Code Llama:成功 +1

問題 6: 使用 Python。 給定一個字串 s 和一個整數 k,返回 s 中長度為 k 的任何子串中母音字母的最大數量。

英語中的母音字母有 「a」、「e」、「i」、「o」 和 「u」。

示例 1:

  • 輸入:s =「leetcode」,k = 3
  • 輸出:2

解釋:「lee」、「eet」 和 「ode」 包含 2 個母音。

🟢 ChatGPT:成功 +1

🔵 Code Llama:成功 +1

問題 7: 使用 Python。 給定一個字串 s,其中包含星號 *。

通過一次操作,您可以:

在 s 中選擇一顆星。

刪除其左側最接近的非星號字元,並刪除星號本身。

刪除所有星星後返回字串。

示例 1:

  • 輸入:s =「leet**cod*e」
  • 輸出:「lecoe」」

🟢 ChatGPT:成功 +1

🔵 Code Llama:失敗 +0

問題 8: 使用 Python。 給定一個表示每日溫度的整數溫度陣列,返回一個數組答案,其中 answer [i] 是在第 i 天之後您必須等待的天數才能獲得較溫暖的溫度。 如果未來沒有一天可以這樣做,則保留 answer [i] == 0。

示例 1:

  • 輸入:溫度 = [73,74,75,71,69,72,76,73]
  • 輸出:[1,1,4,2,1,1,0,0]

🟢 聊天 GPT:+1

🔵 程式碼駱駝:+1

最終結果:

🟢 ChatGPT: 8/8

🔵 CodeLlama: 5/8

綜上,在實際使用效果中,Code Llama 與 ChatGPT 相比並未體現出明顯優勢,不過以上測試並不能完全成為判定依據。而且,開源的 Code Llama 要比 ChatGPT 更容易讓使用者根據需求訂製,或許能夠帶來更多的可能性。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

📍相關報導📍

GPT-4突然變笨?OpenAI被質疑「省成本」導致性能下滑、改變運算模式

Chatgpt之父的最偉大發明》WorldCoin願景:在AI時代建立數十億人的身份和金融網路

CoinFund談投資Worldcoin:除了ChatGPT之父,更看重WLD的全球願景..

Tags: ChatGPTCode LlamaGPT-4Meta

Recommended videos

精選文章搶先看!動區登入Access質押訂閱服務,解鎖寶貴資訊快人一步

精選文章搶先看!動區登入Access質押訂閱服務,解鎖寶貴資訊快人一步

2.5k Views
2024-09-04
    2:48

    Glastonbury introduces new campsite to reduce waste

    2.5k Views
    2024-07-11
      8:33

      Getting Cheap Airfare For Last Minute Travel

      2.5k Views
      2024-06-10
        4:33

        The Night Comes For Us – Official Trailer [HD]

        2.5k Views
        2024-07-18
          Show More
          Copyright (c) 2019 by Jegtheme.
          • About
          • Buy JNews
          • Request A Demo
          • Contact
          No Result
          View All Result
          • Account
          • BlockTempo Beginner – 動區新手村
          • Change Password
          • Forgot Password?
          • Home 1
          • Home 2
          • Home 3
          • Jin-homepage
          • Latest
          • Login
          • Profile
          • Register
          • Reset Password
          • Trending
          • Users
          • Users List Item
          • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
          • 所有文章
          • 關於 BlockTempo

          © 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.

          Welcome Back!

          Login to your account below

          Forgotten Password? Sign Up

          Create New Account!

          Fill the forms below to register

          All fields are required. Log In

          Retrieve your password

          Please enter your username or email address to reset your password.

          Log In

          Add New Playlist