斗1斗2神界大乱斗合集_艺术焦点_突破数据墙!27岁华裔MIT辍学创业8年,年化收入斗1斗2神界大乱斗合集逼近10亿

斗1斗2神界大乱斗合集突破数据墙!27岁华裔MIT辍学创业8年,年化收入斗1斗2神界大乱斗合集逼近10亿

斗1斗2神界大乱斗合集突破数据墙!27岁华裔MIT辍学创业8年,年化收入斗1斗2神界大乱斗合集逼近10亿

突破数据墙!27岁华裔MIT辍学创业8年,年化收入斗1斗2神界大乱斗合集逼近10亿

2023年2月,哈尔滨工业大学空间环境与物质作用前沿科学中心获批立项建设……

文章转载于新智元就在刚刚,创业成功的27岁亿万富翁Alexandr Wang宣布——Scale AI的年化收入,几乎达到了10亿美元!这个数字,足够震惊整个硅谷的。这Scale AI是什么来头,能在营收上取得如此惊人的成绩?原来,它主攻的就是如今AI模型的一大软肋——对数据的巨大需求。我们正在进入LLM开发的第三阶段。 第一阶段是早期的试验,从Transformer到GPT-3 第二阶段是规模扩展 第三阶段是创新阶段:除了o1之外,还需要哪些突破性进展才能让我们达到新的proto-AGI范式Scaling Law的存在意味着,随着模型变大,对数据的需求也呈现指数级增长,越来越多的人担心大模型会耗尽可用数据。Scale AI的主营业务——做AI模型的「数据工厂」,恰好处于这个风口之上。如果能攻克「数据墙」这个AI进步的巨大瓶颈,Alexandr Wang理所当然会赚得盆满钵满。1在AI浪潮中,赚得盆满钵满生意能做这么大,源于Scale AI越做越成功的一项大业务。在AI生态圈中,为大公司提供基础设施或服务支持的业务,市场需求巨大。Scale AI做的就是后者——为这些公司提供人工数据标注员。帮AI公司提高LLM的准确性。Meta、谷歌等大公司,都是它的客户。而且,今年Scale AI的生意越做越红火了。跟去年同期相比,它今年上半年的销售额增长了近4倍,已经接近4亿美元。可以肯定地说,Scale AI是从AI热潮中受益最多的私营企业之一。投资者们当然也看到了这一点。今年5月,Scale AI以138亿美元的估值,进行了新一轮融资。投资者包括Accel、Founders Fund、Index Ventures、Thrive Capital和Greenoaks Capital等。并且,除了亚马逊和Meta之外,Scale AI还吸引了各种各样的新投资者:思科、英特尔、AMD等风险投资部门参与其中,而且很多注资过的公司也回归了,包括英伟达、Coatue、Y Combinator等等。就在近期,Wang手下的高管团队,再度进行了调整。首席技术官Arun Murthy将离开公司,而去年离开风投公司Benchmark的前优步高管Jason Droege将加入公司担任首席战略官,直接向Wang汇报。首席策略官Jason Droege解释自己为什么要加入Scale AI:这让我有机会参与到我一生中技术领域最根本的变革中在Droege看来,Scale解决了人工智能中最困难的挑战之一:通过数据改进模型。做到这一点需要卓越的人才、复杂的运营和对AI未来发展的强烈愿景。虽然团队迄今已经取得了瞩目成就,但仍处于起步阶段。12023年上半年开始,公司收入激增这家成立8年的初创公司,一直负责合同工的招聘和培训,但尚未实现盈利。然而就在今年上半年,它成功改善了运营的毛利率——每产生1美元收入,只需要花费约1.2美元,而在去年上半年,这一数字为1.5美元。如今仅考虑业务成本(比如合同工的工资),Scale AI保留的收入只有一半。毛利率这一财务指标,略低于50%。比起2022年上半年约57%的毛利率,这个数字有所下降。这一水平,大大低于科技投资者对软件公司的期望。但尽管如此,5月份的融资还是为Scale AI提供了雄厚的资金实力。截至上半年末,公司还有约9.8亿美元的现金。从去年上半年开始,公司收入就开始激增。因为构建LLM的客户需要很多合同工,通过向聊天机器人提交问题、撰写答案,来训练AI模型。在给投资者的PPT上,Scale AI自称是「一个人机混合系统,以低成本生产高质量数据」。根据外媒消息,它还通过一家名为Outlier的子公司,雇佣了数十万个小时工,来进行数据微调。显然,Scale AI选择聚焦LLM客户,是一种战略转型。此前,它还有一项类似业务,主要是利用菲律宾和肯尼亚的低成本劳动力,为自动驾驶汽车公司标注数据。但近年来,这项业务的增长已经放缓。现在,即使雇佣薪酬更高、更专业的合同工,Scale AI的收入也依然能提高,因为它可以将这些更高的成本转移给客户。当然,现在Scale AI也并非硅谷投资者眼中稳赚不赔的投资。投资者担忧的问题,包括公司较低的毛利率,以及过度依赖少数几个大客户的问题。1天才少年辍学创办独角兽Scale AI由Alexandr Wang和Lucy Guo于2016年创立,由著名创业孵化器Y Combinator投资。客户包括Meta、微软、英伟达、OpenAI、丰田和哈佛医学院。2019年,Scale AI成为独角兽。2022年,Alexandr Wang成为全球最年轻的白手起家的亿万富翁。Wang于1997年出生于新墨西哥州,父母都是在新墨西哥州洛斯阿拉莫斯国家实验室的物理学家。高中阶段,他开始通过网络自学编程,开始参加世界级编程大赛,如美国计算机奥林匹克竞赛(USACO)。17岁,他成为美国知名问答网站Quora的全职码农;18岁,考入麻省理工学院攻读机器学习;在MIT大一刚结束后的暑假,他就和Guo一起创办了Scale,并且拿到了Y Combinator的投资。Wang跟爸妈说,「这就是我夏天随便玩玩的事。」Scale AI刚起步时,有些人确实觉得这就是一个笑话,毕竟公司当时只有三名员工。不过,在不断地融资和发展之下,Scale AI发展飞速,到2021年已经成长为价值73亿美元的独角兽企业,2023年初公司规模也扩展到了700人。Wang透露,随着企业客户竞相训练生成式AI模型,Scale AI的这方面业务快速增长。2023年,公司年度经常性收入增加了两倍,预计2024年底将达到14亿美元。由于Scale AI的惊人成就,Alexandr Wang已经被硅谷公认为「下一个扎克伯格」。AI模型的「数据工厂」AI领域公认的三个基本支柱——数据、算法和算力。算法领域,前有谷歌、微软的大型研究院,后有推出过Sora和GPT系列模型的OpenAI;算力领域有供货全球的英伟达,但在Scale AI还未诞生的2016年,数据领域仍处于空白。19岁的Alexandr Wang在看到这一点后,做出了辍学创业的决定,「我创办Scale的原因是为了解决人工智能中的数据问题」。大部分数据都是非结构化的,AI很难直接学习这些数据;而且大型数据集的标注一项资源密集型工作,因此,「数据」被很多人认为是科技领域最辛苦、最卑微的部分。但Scale AI却在短时间内就获得了巨大成功。他们可以为不同行业的企业客户量身定制数据服务。在自动驾驶领域,Cruise和Waymo等公司通过摄像头和传感器收集了大量数据,Scale AI将机器学习与「人机回路」监督相结合,管理和标注这些数据。他们曾经开发的「自治数据引擎」,甚至推动了L4级自动驾驶的发展。Wang表示,Scale AI将自己定位为整个AI生态的基础设施供应商,构建「数据铸造厂」,而不仅仅是在子公司Remotasks中雇佣大量的合同工进行人工标注。他强调,来自专家的、包含复杂推理的数据是未来人工智能的必备条件。传统的数据来源,比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程,模型先输出一些内容,例如撰写研究论文,在此基础上,人类专家可以改进这些内容,从而改进模型的输出。「虽然人工智能生成的数据很重要,但想要获得有一定质量和准确性的数据,唯一方法是通过人类专家的验证。」Alexandr Wang在Scale AI的官网上这样写道,「数据丰富不是默认情况,而是一种选择,它需要汇集工程、运营和AI方面最优秀的人才」。Scale AI的愿景之一是「数据丰富」,从而将前沿LLM扩展到更大数量级,「为通向AGI铺平道路。在达到GPT-10的过程中,我们不应该受到数据的限制」。1业内盛赞的LLM排行榜更新Scale AI对业界所做的贡献,不仅是数据标注这么简单。今年5月,Scale AI重磅推出了全新LLM排行榜——SEAL,开始对前沿模型开展专业性评估。对于这个榜单,Jim Fan大加赞赏。他认为SEAL是LMSys的非常好的补充和参照,提供公开模型的私密、安全、可信的第三方评估。对此,Andrej Karpathy也深以为然。随着OpenAI最强模型——o1的推出,SEAL排行榜也第一时间进行了评测。除了在高级编程、数学和科学等领域表现出色之外,o1系列也为「prompt engineering」(提示工程)引入了新的变化。左右滑动查看在工具使用和指令跟随方面,o1-preview表现出色。而在编程能力方面,o1-mini夺得榜首,o1-preview紧随其后位居第二。- 编程排行榜在SEAL编程排行榜上,o1-mini以1271分的成绩领跑,紧随其后的是o1-preview,得分为1198。评估数据集使用了1000个提示词,用于测试各种编程任务,涵盖从代码生成到优化和文档创建等多个方面。过程中,每个模型的响应都会从正确性、性能和可读性三个维度进行评估,综合运用人工审核和代码执行测试的方法。- 指令跟随排行榜在对精确指令跟随能力的评估中,o1-preview以87.27 分的成绩领先,超越了知名Claude 3.5 Sonnet和Llama 3.1 405B Instruct。评估数据集包含1054个跨领域的提示词,涉及文本生成、头脑风暴和教育支持等多个方面。提示工程的变化与我们熟悉的GPT、Gemini或Claude等模型相比,o1模型的提示词使用和可操控性明显不同。根据OpenAI的建议,简单直接的指令有助于充分发挥o1的潜力。与之前的模型不同,用户应避免要求模型进行思维链推理。他们还指出,提示词中的无关上下文对o1模型的干扰可能比之前的GPT系列更大,因此在检索增强生成(RAG)提示中加入一些示例很重要。Cognition Labs发现,要求模型「think out loud」(大声思考)实际上会损害性能,而只要求给出最终答案反而会提高性能,因为o1模型无论如何都会产生内部的思维链。他们还指出,冗长或重复的指令会损害性能,而过于具体的指示似乎会影响模型的推理能力。虽然o1在基准测试中取得了出色的结果,但让它完成你自己的具体任务似乎需要更多努力——它们往往会忽视明确(甚至是强调的)关于如何解决问题的指令。由此可见,现实世界的提示和基准测试中使用的提示之间,实际上存在着不小的差距:后者旨在只包含明确的、自包含的、最小呈现的问题,没有关于如何解决它们的建议或意见。需要注意的是,o1-preview响应的延迟,特别是其「首个token的时间」,明显高于GPT-4o。不过,o1-mini用更快的token推理速度弥补了「思考」的时间。一些实测- 词汇约束在官方示例中,o1在臭名昭著的「strawberry这个词中有多少个R?」等「陷阱」任务上,有着不小的改进。为了验证这一点,我们向o1-preview提出了一个新编写的谜语:「说出一个拉丁语源的英语形容词,它以相同的字母开头和结尾,总共有十一个字母,并且词中所有元音按字母顺序排列。」在第一次尝试中,模型成功解决了这个谜语,答案是:sententious。但如果反复提问同一个,o1却并不能次次做对:sententious ✅facetiously ❌transparent ✅abstentious ❌facetiously ❌- 解码密码同样令人深刻的,还有一个解码复杂密码的例子。类似的,我们也尝试了这个提示词的各种变体,包括ROT13密码、Atbash密码、Base64编码、反转字符串等各种组合。然而,大多数测试都不成功——在7次尝试中,o1-preview只有2次能够解码给出的加密信息(《沙丘》中的「迎恐祷词」(the Litany Against Fear))。在每个prompt中,o1都被要求从OpenAI给出的示例中推断出一种编码方式。在以下每个测试中,o1都未能在一次尝试中解码目标消息:ROT13密码 → 反转字符串 → Base64编码 → 反转字符串ROT13密码 → Base64编码 → ROT13密码 → 反转字符串ROT13密码 → Base64编码 → ROT13密码ROT13密码 → Base64编码 → Atbash密码ROT13密码 → Base58编码在第一次尝试中成功解码的两个测试是:Atbash密码 → Base64编码ROT13密码 → Base64编码这里展示了第一个成功的例子——其他测试除了使用的编码不同外,都是相同的:结论总结来看,OpenAI的o1模型在推理能力方面都取得了重大突破,在AIME、Codeforces、Scale的SEAL排行榜等关键基准测试中表现出色。这些结果表明,o1-preview和o1-mini是解决复杂推理问题的强大工具。然而,要充分发挥这些模型的潜力,可能需要比用户习惯的其他模型发布更多的实验和尝试。参考资料:https://www.theinformation.com/articles/scale-ais-sales-nearly-quadrupled-in-first-half?rc=epv9gihttps://scale.com/blog/first-impression-openai-o1?utm_offer=blog

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:甘铁生

TOP1热点:春节答题 PK 分奖金

而在昔日上海企业与子弟大量迁入的三元区,则要“老树发新枝”——三钢集团在可持续发展、生态环境建设上不断发力,狠抓精细化管理。“班组下班时采集上报水、电、煤气等的消耗情况,大家会‘斤斤计较’,这在职工收入考核中占40%左右。”炼钢厂运转车间相关负责人说。。

党的十八大以来,以习近平同志为核心的党中央将生态文明建设纳入中国特色社会主义事业“五位一体”总体布局,把“美丽中国”作为生态文明建设的宏伟目标,引领亿万中国人民走上生态文明之路。党的二十大报告将“人与自然和谐共生”确立为中国式现代化的基本特征之一。习近平总书记强调,必须牢固树立和践行绿水青山就是金山银山的理念,站在人与自然和谐共生的高度谋划发展。这体现了中国“天人合一”的古老智慧,也是一种更符合全人类共同利益的发展方向。

TOP2热点:OpenAI 被曝训出 GPT5

波兰《共和国报》报道称,波兰官员表示,不排除这艘游艇一开始就被用来分散注意力的可能性,其目的是让整个调查走上错误的轨道。

命运以痛吻我,我却报之以歌。

TOP3热点:新格伦火箭首发成功入轨松下纱荣子被操爽视频

两个颇有历史的比赛为何忽然火了起来?除了当地政府大力支持外,媒体和短视频平台的助力功不可没。比如,贵州“村超”获央视新闻直播,短视频平台相关话题累计播放量超10亿次。巨大流量要适度开发,更要着眼长远。

这些措施旨在针对产业链、人才链的短板弱项,有效推进学科专业体系与制造业转型升级相适应。

TOP4热点:如何看待中美两国网友开始对账tttzzz18.su黑料入口

“国内企业在境内外盐湖、钾矿资源的开发中,所依赖的技术人才和管理人才,绝大多数都经历过青海盐湖产业的锻炼和培养。”张萍告诉记者,她本人就是在察尔汗盐湖成长起来的。如今,她带队参与老挝万象钾肥项目的规划设计与建设工作,该项目的管理和技术团队成员同样主要来自青海。

习近平总书记提出的“第二个结合”,是我们党对马克思主义中国化时代化历史经验的深刻总结,是对中华文明发展规律的深刻把握,表明我们党对中国道路、理论、制度的认识达到了新高度,表明我们党的历史自信、文化自信达到了新高度,表明我们党在传承中华优秀传统文化中推进文化创新的自觉性达到了新高度。

TOP5热点:支付宝回应订单八折:不会追款爱情岛论坛亚州品质自拍百度

职业教育的生命力在于实践和应用。《方案》支持地方出台符合本地实际的落地政策。这有助于用好用活政策,推动政策精准落地。

刚进入21世纪时,金华市浦江县的人造水晶产业达到鼎盛时期:一个县集聚了两万多家水晶加工作坊。但这里的生态环境几乎走向绝境:县域内85%的河流成了“牛奶河”“垃圾河”“黑臭河”。

TOP6热点:美国没有 TikTok 平替吗王者女英雄被捅哭流口水流眼泪

北京东城区聚焦企业需求,发布产业发展全要素政策服务包;山东青岛高新区以经营主体为中心,建立“让企业家来评价”机制;西安高新区推出“歇业休眠”“证照联办”“证照联销”等一系列办照套餐方便企业办理……近期,各地围绕经营主体需求,持续优化营商环境,激发企业活力。

福建南方制药研发团队透露,在复旦大学环境科学与工程系团队的帮助下,“人工栽培”与“提取纯化”两个关键环节获得突破。数年间,明溪拥有了全国最大的红豆杉人工栽培基地。同时,多项合作专利把提取剂对环境的污染降到最低,并大幅度提高了紫杉醇的纯度。随着紫杉醇提取工艺的规模化、产业化,明溪县的红豆杉产业成功实现升级,改变了长期处在产业链低端的被动局面。

TOP7热点:趁过年,以旧焕新「家生活」明里轴在线观看

而在昔日上海企业与子弟大量迁入的三元区,则要“老树发新枝”——三钢集团在可持续发展、生态环境建设上不断发力,狠抓精细化管理。“班组下班时采集上报水、电、煤气等的消耗情况,大家会‘斤斤计较’,这在职工收入考核中占40%左右。”炼钢厂运转车间相关负责人说。

“这是目前世界上唯一利用盐湖资源电解生产金属镁的项目。该项目的14套主装置中,已有12套打通了工艺流程。”青海盐湖镁业有限公司总经理王锋林说,项目达产后,将从根本上解决盐湖资源利用梗阻,推动我国金属镁产业形成绿色、低成本优势,在以金属镁、镁基材料为主的新兴产业国际竞争中赢得先机。

TOP8热点:为何人拎着重物站着不动还会觉得很累adc年龄确认欢迎您

“我期待在体育和文化方面与中国进行更多的合作。”格里菲思说。

他既是一位著名诗人,也是一位出色的书法家。“墨似熔岩、诗如沉雷”是他的真实写照。他恪守中国传统文人的社会责任,不遗余力地运用手中之笔,关注社会,关注人民,创作诗歌七千余首,为社会弘正气,为人民弘美德,为社会主义文艺事业繁荣发展贡献自己的才智和力量。

TOP9热点:支付宝回应订单八折:不会追款柚子猫甘雨内射频大全

北京大学第三医院眼科副主任医师周吉超:高考结束后,考生们拥有了充分使用电子产品的自由,但对于刚刚脱离“时间控制”的考生们来说,很容易出现过度使用电子产品、“报复性熬夜刷手机”等不良行为。

——深化改革,持续优化营商环境。

TOP10热点:Kimi 多模态推理模型 k1.5内射xxx

古人其实早就喜欢把各种果干放进粽子里,美食家苏轼还发明了杨梅粽。《玉台新咏》中说,“酒中喜桃子,粽里觅杨梅。”后来苏轼曾借用过这个典故,在元祐三年所写的端午帖子中说,“不独盘中见卢橘,时于粽里得杨梅”。

邹韵:您曾说过,您感到十分自豪,因为您在2015年夏天成为首个和中国签署“一带一路”合作谅解备忘录的欧洲国家外长。外长先生,是什么令您如此自豪?您对未来的新发展有何愿景?

发布于:雷波县