手机浏览器扫描二维码访问
这不,在叶源引导小丽成长为Scarlett的时候,玛凯希又再次高调召开了一次发布会。
这次,他的X-AI发布了更新版的Grgk3大模型,并公开了最新的测试结果。
根据公布的相关数据得知,Grgk3在包括AIME和GPQA等基准测试中,更新版本的系统远超GPP-4o、Gamini-2Pro、AbyssalV3、Clavde3.5So等大模型。
在国际大模型竞技场ChatbotArena(LMSYS)测试中,X-AI首席工程师表示,早期版本的Grgk3获得了第一的成绩,就达到了140分,超越了Gamini2.0FlashThinking实验版本、ChatGPP-4o最新版本,以及最近大火的AbyssalR1等等。
这一次,更新版本的Grgk3成绩更是达到了180分!
为此,全世界各大媒体再次将Grgk3吹上了天。
但是,所有人都不知道的是,在种花南沪地界。
叶源的Scarlett系统,几乎是在同一时间做了测试。
Scarlett系统融合了Matrix系统和Abyssal系统的精华,其性能之强大可以用恐怖来形容。
“开始基准测试。”
叶源通过系统远程下达指令。
第一项是计算能力测试。
Scarlett系统仅用0.8秒就完成了百亿亿次浮点运算,而Abyssal系统需要20秒,grok3更是耗时15秒。
在量子计算模拟中,Scarlett仅用3.2秒就完成了100万次量子门操作,是Abyssal的60倍,grok3的50倍。
对于这个测试,叶源还算比较满意。
“进行深度学习测试。”
叶源远程调出Image数据集,开始第二轮测试。
Scarlett在图像识别任务中达到了99.98%的准确率,训练时间仅需8分钟。
相比之下,Abyssal的准确率为98.5%,训练时间2.8小时;grok3准确率98.2%,训练时间2.2小时。
在自然语言处理任务中,Scarlett的中文理解准确率达到99.99%,英文99.95%,远超Abyssal的93.3%和grok3的95.8%。
随后,叶源又进行了一系列专业学科性测试。
妖孽保镖在都市 隐形大富豪:苟在学校当老师 情深似海A 重回1991 超市通古今:我娇养的大将军造反了 权力法则 别对我有非分之想 医武天神 浮生剑仙 退婚龙婿 闪婚千亿富豪后,我无痛当妈 少爷乱认妈!夫人抛夫弃子不回头 我有一枪:我无敌,你们随意! 道君,从蓬莱筑基开始 顾少暖婚小娇妻 误撩大佬,安总她不想结婚 宿敌总喊我老婆[穿书] 嫁给豪门老男人,小娇妻被宠疯了 前妻麦琳,你劝我复婚? 爱意上膛
一代战神秦九州重归都市,为弥补遗憾,搅动风起云涌,以不败之资横行四方,诸天震颤。...
这是一个光怪陆离神秘莫测的修仙世界,古老传说的苍梧之城,蓬莱仙境都是真实存在的,古树扶桑,栖息着落日金乌人神共舞,仙与凡,仅一线之隔。大道无情,物竞天择,是残酷的竞争迈入仙道,成为高高在上的神仙?还是沦落为碌碌凡人,平庸终生?确实是一个值得深思的问题。这是一个现代风水大师误闯修仙世界的故事!盗别人的墓,修自己的仙!楚雁栖语录...
2014年1月1日,悲剧的李胜林因为和身为李胜基狂粉的女友吵架而被车撞死,而附身穿越到了2006年一个同名的韩国人身上。然后居然一个不小心成为了一个单身爸爸,接下来就让我们看这个单身爸爸能不能在韩国娱乐圈给自己的宝贝儿子找到一个合格的妈妈,或者找回孩子他亲妈吧!...
身为玄学界公认的第一大佬,沈西园早就知道自己活不过18岁原想着自己在地府有关系,死了就当是换个环境可没想到,一睁眼她竟然穿进了一本无脑虐渣爽文小说中,成了坏事做尽被女主狂虐入狱的那个渣渣女配必须按着剧情走?沈西园表示,剧情算什么,该玩坏时就玩坏虐渣爽文?嗯,她很期待,谁是被虐的那个渣,谁是虐渣的那个爽!...
简介还没想好。应该是一本能打发时间的书吧。早上九点,下午六点自动更新。浮屠出去散心了。自动更新已经排了很久。。。...
...