郭长征一惊,转头看向窗外。

  虽然此时没有阳光直射进来,但外面的天色已经明显泛白。

  “这……居然快天亮了?”郭长征觉得一阵恍惚。

  两人这大半个晚上,连水都没怎么顾得上喝。

  完全沉浸在那种发现新大陆的极度亢奋之中,根本没有察觉到时间的流逝。

  “效率太高了。”郭长征看着满屏整洁的代码。

  “如果按照我以前的计划,把这个复杂的网络架构用底层代码实现,起码得两个月。”

  “而现在,一晚上,全搞定了。”

  楚一航摸了摸肚子,感觉胃里空空如也,饿得有点难受。

  “郭老师,模型搭好了,咱们现在就让它跑起来吧?”

  “跑!必须跑!”郭长征此刻也顾不上疲惫。

  楚一航打开浏览器,登录了ImageNet的官方网站。

  由于完整的数据集高达上千万张图片,庞大,全部下载不仅耗时,楚一航硬盘也装不下。

  于是,他们只勾选了其中一个非常小的数据子集,大概几万张图片,涵盖了猫、狗、汽车等常见的十几个分类。

  点击下载。

  趁着下载的间隙,楚一航写了一个简单的数据预处理脚本,把图片统一缩放并转化为框架能读懂的张量格式。

  下载完成,数据加载完毕。

  楚一航深吸了一口气,敲出了运行命令,按下回车。

  工作站机箱里的几块顶配AMD显卡风扇,瞬间开始加速旋转,发出低沉的轰鸣声。

  屏幕的终端上,开始一行一行地跳出训练进度的提示。

  进度条开始缓慢地向前推移。

  郭长征和楚一航盯着那个进度条看了足足五分钟。

  “一航,这速度,大概要跑多久?”郭长征估算了一下时间。

  楚一航看着系统给出的剩余时间预估。

  “郭老师,虽然咱们这是最顶配的显卡,算力已经很强了。”

  “但咱们这个网络层数不少,哪怕只是几万张图片的子集,跑完这50轮训练,预估也得好几个小时。”

  此时,通宵过后的后遗症开始疯狂反扑。

  两人都感觉到了那种又累、又困、又饿的虚脱感。

  大脑已经开始有点不转了。

  楚一航站起身,活动了一下僵硬的关节。

  “郭老师,你这也累坏了,再熬下去身体吃不消的。”

  “我这房子正好是两居室,咱正好一人一间房。”

  楚一航指了指走廊。

  “咱们先去休息一下,踏踏实实睡一觉。”

  “机器就在这儿自己跑着,等结果出来了咱们再回来看。”

  郭长征在脑子里过了一下日期。

  今天是周六,周末不用去学校上课,也没有行政会议。

  而且,他心里也极度期待,这个折腾了一晚上的全新架构,到底能跑出什么样的结果。

  如果不看到最后的结果,他觉得自己就算回家也根本无法安心。

  “行,一航,那我就厚着脸皮在你这儿叨扰一下了。”郭长征答应下来。

  两人各自进了一间卧室,关上门。

  楚一航连衣服都没脱,倒在床上就闭上了眼睛。

  但他发现,自己的大脑皮层极度活跃。

  一闭上眼,满脑子全是代码、张量、矩阵和各种报错信息。

  他翻来覆去地换了好几个姿势,好不容易才迷迷糊糊地陷入了浅睡眠。

  大概过了三个多小时。

  楚一航猛地睁开眼睛,看了一眼手机上的时间。

  上午九点十分。

  他觉得自己好像睡了,又好像根本没睡。

  那种对实验结果的强烈期待,就像一个小钩子一样,不断地挠着他的神经。

  他翻身下床,穿上拖鞋,走出卧室。

  刚走到客厅,楚一航就愣住了。

  郭长征已经坐在了工作站前面,眼睛死死地盯着屏幕。

  “郭老师?”楚一航走过去打了个招呼。

  “你这……怎么就睡了这么一会儿?不多休息一下?”

  郭长征回过头,眼睛里布满了红血丝,但精神状态却异常亢奋。

  “一航,我根本就没睡着。”郭长征指了指自己。

  “我在床上躺了两个小时,脑子里全在推演这个模型的结果。”

  “因为太期待了,实在躺不住,就起来盯着了。”

  楚一航拉开椅子坐下,看向屏幕。

  终端上的提示显示,训练已经进行到了最后一轮的最后几分钟。

  机箱风扇的转速依旧很高。

  两人谁都没有说话,客厅里安静,只有机器的运转声。

  终于,进度条走到了100%。

  接着,程序开始在验证集上进行最终的测试评估。

  几秒钟后,两行关键的评估数据打印在了屏幕上。

  TOp-1准确率: 50.23%。

  TOp-5准确率: 70.81%。

  郭长征愣了几秒,随后猛地从椅子上站了起来。

  楚一航也是一脸震惊,直接爆了句粗口:“卧槽!牛逼!”

  两人兴奋地在半空中重重地击了个掌。

  两声清脆的巴掌声在客厅里回荡。

  他们太清楚这两行数字所代表的含金量了。

  激动得脸都红了。

  在普通人眼里,这只是两个干巴巴的百分比。

  但在懂行的科研人员眼里,这就是炸裂的神迹。

  所谓的TOp-1准确率达到50%,究竟是个什么概念?

  简单来说,随便给这个刚搭好几小时的AI模型扔一张它从来没见过的图片,比如一张猫的照片。

  模型经过计算后给出的第一个判定答案,有足足一半的概率,会精准无误地指出这是一只“猫”。

  虽然它也有一半的概率会猜成狗或者别的什么东西,但这个首选命中率,在当时的技术背景下已经高得吓人。

  而TOp-5准确率高达70%,则更加恐怖。

  这意味着,哪怕模型偶尔犯迷糊,没把正确答案排在头名。

  只要它给出的前五个最有可能的猜测名单里,比如依次写着“老虎”、“小狗”、“猫”、“狐狸”、“越野车”。

  由于“猫”这个正确选项出现在了前五名的列表里,在测试标准中就算它预测成功。

  这种极具包容度的准确率,达到了惊人的百分之七十。

  两人之所以激动得有些失态,甚至在半夜的客厅里大喊大叫,是因为这个成绩放在当下,完全是不可思议的。

  要知道,他们今晚使用的资源极其寒酸。

  为了图快,他们根本没有去下载ImageNet那多达一千五百万张图片的完整数据集。