广告

单张英伟达RTX 3090显卡即可运行,复旦MOSS大模型正式开源

2023-04-23 14:01:35 综合报道 阅读:
4月21日,复旦大学自然语言处理实验室开发的新版MOSS模型正式上线,成为国内首个插件增强的开源对话语言模型。目前,MOSS模型已上线开源,相关代码、数据、模型参数在Github和Hugging Face等平台开放,供科研人员下载。

4月21日,复旦大学自然语言处理实验室开发的新版MOSS模型正式上线,成为国内首个插件增强的开源对话语言模型。目前,MOSS模型已上线开源,相关代码、数据、模型参数在Github和Hugging Face等平台开放,供科研人员下载。XhGednc

XhGednc

Github开源内容,地址:https://github.com/OpenLMLab/MOSSXhGednc

MOSS作为一个拥有160亿参数的开源对话语言模型,由约7000亿中英文及代码单词预训练得到,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS支持中英双语,拥有多轮对话和使用多种插件双重能力,在MOSS界面,用户可自主添加搜索引擎、图像生成、方程求解器、计算器等外部插件工具。XhGednc

XhGednc

XhGednc

Moss的架构设计基于Spring Boot Admin 2.1.3版中的spring-boot-admin-server模块二次开发,基于可扩展思想。前端采用Ant Design Pro,采用Spring Boot+shiro+JWT+LDAP实现整个权限认证管理。通过Moss-Cloud-Adapter模块支持多注册中心,应用启动对应用名进行check是否规范。此前,MOSS已经经历了两版迭代,一版是公开邀请内测的MOSS 002版本,另一版是内部测试版本OpenChat 001。今年二月份EDN的“国内首个类ChatGPT模型MOSS内测”相关报道,正是MOSS 002版本。这次MOSS开源的是第三轮迭代版本,名叫MOSS 003。XhGednc

XhGednc

当然,MOSS 003也并非开源了全部模型,目前主要开放的是基座预训练模型,最终模型即将在近期开源。复旦大学计算机科学技术学院教授MOSS系统负责人邱锡鹏表示,未来,MOSS将陆续开源更多训练数据及模型参数,同时也为企业私有化部署人工智能模型、开展相关服务提供解决方案。XhGednc

责编:Ricardo
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 2024诺贝尔奖公布,竟然有两项都颁给了AI? 诺贝尔奖被普遍认为是在世界范围内,所有颁奖领域内能够取得的最高荣誉,最近,2024年的诺贝尔奖获奖名单也陆续公布了出来,而在目前公布的奖项中竟然有两项都与人工智能相关···
  • 无处不在的 Arm 软硬件生态赋能开发者 AI 创新 人工智能 (AI) 是当今最重大的技术变革之一,并正以前所未有的速度推动着各行各业的发展···
  • AI普及给嵌入式设计人员带来新挑战 探讨了人工智能(AI)的普及给嵌入式设计人员带来的新挑战。在创建“边缘机器学习(ML)”应用时,设计人员必须确保其能有效运行,同时最大限度地降低处理器和存储开销,以及物联网(IoT)设备的功耗。
  • 自制一个能拍照、能回答问题的智能眼镜,只要180块? 在Meta近日举办的Llama 3 hackathon黑客马拉松活动中,一项名为“Open Glass AI”的开源项目仅花费了20美元(约144元人民币)的物料成本就将一副普通的眼镜改装成了智能眼镜,成功斩获了比赛第一名···
  • 设计汽车雷达系统的挑战 高清雷达在任何天气条件下都能有效地进行基于人工智能的前端物体探测,与其他传感器通道相辅相成,进一步提高了准确性和安全性。对于构建高价值嵌入式雷达系统的制造商来说,市场潜力巨大。然而,如何有竞争力地发掘这一潜力却充满挑战。在本文中,我们探讨了其中一些挑战。
  • 相变存储新方向:无需提升生产工艺,功耗表现提升15倍 近日,韩国科学技术院(KAIST)的研究团队成功开发出一种超低功耗的下一代相变存储器,这一存储设备有望替代现有内存,并为未来的人工智能硬件实现神经拟态计算提供支持···
  • 英特尔推出全球最大神经拟态系统,速度比人脑快200倍 4月18日,英特尔宣布,其打造出了全球最大的神经拟态系统——Hala Point,该系统内置1152个英特尔Loihi 2处理器,拥有11.5 亿个神经元和1280亿个突触,速度最高可达人脑的 200 倍···
  • Meta推出下一代AI基础设施MTIA芯片,整体性能提升达3倍 2023年,Meta推出了元训练和推理加速器(MTIA)v1,这是一款专为Meta的深度学习推荐模型设计的第一代人工智能推理加速器,与上一代相比,最新版本芯片的性能得到了显著的提升···
  • AI软件工程师已至:可独立开发项目,程序员饭碗真没了? 使用Devin进行开发,人类用户只需通过聊天机器人式的界面,用自然语言提示的方式概述项目,Devin就会按照要求完成所有工作。它首先会创建一个详细的分步计划来完成指定的任务,然后开始使用开发人员工具,就像人类程序员所做的一样,而速度要快得多···
  • 宝座易主,Claude 3超越GPT-4成为全球最强模型 Claude 3系列的旗舰模型Opus在本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等多个测试中均超越了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra,并在复杂任务上表现出接近人类水平的理解力和流畅性···
  • 人工智能安全关键型系统中的验证和确认 人工智能法规和 V&V 过程将对安全关键型系统产生重大影响。人工智能越来越多地用于系统设计,包括汽车和航空航天工业等领域的安全关键型应用。
  • Cadence推出全新数字孪生平台Millennium Platform,提 颠覆性的专用软硬件加速平台;利用GPU和CPU计算以及专有软件算法,提高准确度、速度和规模的同时,带来高达100倍的设计效率提升;与传统HPC相比,支持GPU-resident模式的求解器可将仿真能效显著提高20倍;将数字孪生、人工智能和HPC技术相结合,为汽车、航空航天、能源、叶轮机械和数据中心提供更优的多物理场仿真解决方案;利用创新的生成式人工智能技术,进一步加速设计和分析探索,获得卓越的设计洞见,提供更好的系统解决方案;支持在云端或本地进行CFD多物理场分析,以满足客户的业务需求
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了