详解Modular：LLVM之父如何打造未来AI引擎语言？

2023-09-18 209 观点

本文结构

1.什么是编译器？

2.关于LLVM之父Chris Lattner

什么是XLA和MLIR
LLVM是什么？
什么是Clang
Clang和LLVM的关系

3.关于Modular

Modular——人工智能引擎
关于谷歌的TPU
关于深度学习和可编程性
实际构建引擎的过程中存在有哪些技术挑战？

4.关于创业，和工程团队建设、AI的未来

一、什么是编译器？

编译器(Compiler)，是一种将高级编程语言翻译成计算机可执行代码的软件工具，编译器将程序员编写的源代码转换成计算机可以理解和执行的二进制指令，这些指令被打包成可执行文件或库，以便在计算机上运行程序。

编译器的主要工作流程是源代码（source code）→预处理器（preprocessor）→编译器（compiler）→目标代码（object code）→链接器（Linker）→可执行程序（executables）

再举个形象的例子：

老师：小朋友们，今天我们学习加法。

bla bla bla ……

小朋友们：老师，我们学会了。

老师：现在你们就是能读懂 1+1=？的编译器了

二、LLVM之父Chris Lattner

在讲Modular之前，我们先讲讲Chris Lattner的经历，他1978年出生在美国加利福尼亚州，在旧金山湾区长大，很年轻的时候就开始编程，之后他在UC Berkeley获得计算机科学学士学位，并在斯坦福大学（Stanford University）攻读博士学位，方向主要是编译器优化和自动并行化。

Chris Lattner在读博士学位期间主导开发了 LLVM，因为LLVM，获得了 2012 年 ACM 软件系统奖（ACM Software System Award)。之后，Lattne被苹果聘用，在苹果公司负责了许多重要项目，包括Clang编译器前端、Swift（取代 Objective-C 的语言）编程语言的设计和开发，以及Xcode开发环境的改进。Swift语言因其简洁性和性能而受到广泛欢迎，并被开发者用于iOS、macOS和其他苹果平台的应用程序开发。

离开苹果公司后，Chris Lattner曾在特斯拉（Tesla）和谷歌（Google）等公司工作，并继续在编程语言和编译器技术领域发表研究论文和参与开源项目，在谷歌负责领导 Tensorflow 基础架构团队，创建了 XLA和 MLIR。

这里我们解释一下什么是XLA和MLIR：

XLA（Accelerated Linear Algebra：加速线性代数）是一种针对特定领域的线性代数编译器，能够加快 TensorFlow 模型的运行速度，而且可能完全不需要更改源代码。它可以提高运行速度并改进内存用量。

MLIR（Multi-Level Intermediate Representation：多级中间表示）是一种编译器框架，它的设计优化了编译器，基本把编译器设计中的通用部分全部包揽，极大地方便了编译器的开发人员。

还有更重要的，LLVM是个啥？（以下摘自简书，原文见参考链接）

可以把LLVM理解为模块化、可重用的编译器以及工具链技术的集合。LLVM（其实是Low Level Virtue Machine的全称，但是它从来没被用做虚拟机）所以后面LLVM也不是首字母缩略词; 它是项目的全名。