硬件架构 | Answer

GPU的SIMT执行模型：为什么32个线程必须执行同一条指令

在AI浪潮席卷全球的今天，GPU已经成为最关键的硬件基础设施。训练一个千亿参数的大语言模型需要数万张GPU协同工作，而每一张GPU内部又同时运行着数百万个线程。这种前所未有的并行能力从何而来？答案藏在GPU最核心的执行模型中——SIMT（Single Instruction Multiple Threads）。 ...

GPU渲染管线如何将3D世界变成屏幕像素从固定功能到可编程着色器的三十年演进

当你打开一款3A游戏，看到屏幕上那些令人惊叹的画面时，你是否想过：这些虚拟的3D世界是如何变成你眼前那几百万个像素的？这个问题的答案藏在一个被称为"渲染管线"的技术架构中。它不是魔法，而是一套精密设计的并行计算系统。从1999年NVIDIA推出GeForce 256——第一款被正式称为GPU的图形处理器——至今，这套系统经历了从固定功能到完全可编程的革命性演进。 ...

一个接口统一数字世界：USB Type-C如何用十年重构三十年接口混乱

1996年1月，Intel工程师Ajay Bhatt站在拉斯维加斯COMDEX展台上，看着团队将127台打印机同时连接到一台PC。当Bill Nye插上最后一台设备时，全场爆发出掌声——Universal Serial Bus（通用串行总线）终于让"即插即用"成为现实。 ...