林野面对着网速瓶颈的无奈,一时找不到突破口,思绪很快被拉回眼下最紧迫的任务上。
“先不说未来的全息和通信了,回到现实。CERN 那两年的对撞机原始数据,实际体积到底有多大?我们总不能真的拖几个月去传输吧。”
吴军看着他,脸上没有多余的表情,语气平静得像在说一件再普通不过的事,“我已经拿回来了。”
林野一愣:“拿回来了?你们是拉了专线,还是用了科研专用网络?”
吴军轻轻摇头,“没有那么复杂。我们安排了两个人,坐飞机过去,带了一整箱超导硬盘。到了 CERN 机房,直接接入他们的存储系统全速拷贝,装满之后装箱,再坐飞机回来。”
他顿了顿,淡淡补充了一句:“前后一共就一天。”
林野瞬间怔住,好半天没反应过来。
前一秒他们还在讨论未来传输架构、光速瓶颈,还对快递运输硬盘的方式不满,结果现实里如此直接、粗暴的解决 EB 级数据迁移的方式真的让他惊喜了一下,虽然这种方式是别想用来打游戏了。
“一箱…… 超导硬盘?” 林野下意识追问,“一天时间,到底拷回来了多少数据?”
吴军抬眼瞥了他一下,语气淡然地开始算账。
“我们用的还不是你的实验室款的 5000 层堆叠,而是对外推出的商用稳定版本 1000 层超导存储盘,单颗容量 16PB。一个便携安全箱,内部可以整齐摆放 100 ×10=1000 颗。”
“单箱总容量:1000 颗 × 16PB = PB = 16EB。”
林野瞳孔微微一缩,16EB,相当于全人类互联网数小时产生的数据总量。刚刚还说接受不了这种方式,转头就被导师用现实给教育了。
吴军只是派人带了一个手提箱,一天之内,就完成了全世界所有光纤加起来都要跑几十天的传输任务。
吴军看着他震惊的表情,语气依旧平静:“你看,这就是现实。在真正的海量数据面前,没有任何一种网络,能跑得过装满硬盘的飞机。你刚才纠结的网速、延迟、带宽,在这个方案面前,全都没有意义。”
林野深吸一口气,吴军不是在提出一个理论方案,而是已经用一次真实的行动,给他上了最直观的一课。在物理天花板被打破之前,一箱硬盘、一趟航班、一天时间,就是人类最强的传输协议。
林野定了定神,从那一箱硬盘一天运回 16EB 数据的现实冲击里抽离出来,思维回到正事上,“吴老师,数据都已经完整拿回来了,那计算应该已经开始了吧?”
他心里很清楚这套存算单元的恐怖算力,即便如此,面对 CERN 整整两年的原始对撞数据,他保守估算,怎么也得将近一个小时才能彻底跑完。
吴军看了他一眼,语气平淡,“早就结束了。而且这次,实验室把设计出来的五种原型,全部同步跑了实测对比,布线、调度、颗粒度都拉到了最优,刚好趁这个机会,看看哪套最适配这种顶级科学计算任务。”
林野眼神一凝,瞬间回过神 —— 五种原型,是吴军和他耗费数周心血打磨的不同方向,现在还不是搞专用计算的时候,主要是找通用计算的最优方案,他立刻追问:“您把五种都测了?结果怎么样?”
吴军指尖在屏幕上一划,五条截然不同的性能曲线瞬间铺开,旁边清晰标注着每种原型的参数、耗时、优缺点,还有布线工程的评估,语气严谨的说道:“先把五种原型的实测情况,一条条跟你说清楚。这里全是硬数据,也结合了布线等工程实际。咱们是室温超导,临界温度都在 200 摄氏度以上,不用考虑发热,只看布线难度、调度效率和算力释放。”
“第一种,也是你最初提的那套:每 100 万个存算小单元(2048 比特),对应一个强计算核心。实测耗时 8 分钟。优点很明显,强算力集中,控制逻辑最简单,布线极其规整,工程难度最低,后期维护也方便,适合大规模批量运算;缺点是灵活性太差,小颗粒任务会严重浪费算力,比如 CERN 数据里的粒子轻量追踪,根本吃不满强计算中心的算力,有点‘大材小用’,算力利用率上不去。”
“第二种:每 400 万个存算小单元(2048 比特),对应一个强计算核心。实测耗时 12 分钟,是五种里偏慢的。优点是算力密度更高,单核心负载更均衡,布线长度最短,数据传输延迟最低;但缺点也很突出,颗粒度太粗,碎片任务调度效率极低,而且 400 万个单元绑定一个强核,一旦强核出现调度瓶颈,整个分组都会卡顿,容错率不高,布线虽然短,但分组过于庞大,后期故障排查难度大。”
“第三种:没有强计算核心,存算小单元为 2048 比特,可根据计算任务自由组合。实测耗时 18 分钟。优点是灵活度中等,适配常规的科学计算任务,不用考虑强核与单元的绑定布线,布线压力小,后期可扩展性强;缺点是没有强计算核心,面对 CERN 数据里的复杂数值运算,比如圈图积分、粒子能量拟合,只能靠 2048 比特单元拼接运算,速度很慢,而且 2048 比特单元颗粒偏大,超细并行任务根本跑不满,算力浪费严重。”
这章没有结束,请点击下一页继续阅读!