[TOC]

1. Core ML 简单介绍

Core ML

2014 年， iOS 8 发布，苹果带来了自己的渲染引擎 Metal。在 iOS 上进行机器学习成为可能。开发者可以通过Metal 直接和GPU打交道，利用GPU 做并行计算。 15、16 两年，苹果在完成 iOS 9 和iOS 10 两代系统更新时带来了 BNNS （Basic Neural Network Subroutines）和 MPSCNN 。前者利用CPU 上的高效指令集完成数学计算，后者在 Metal 上提供了高性能的 shader，利用这些 shader ，用户不再需要直接操作系统硬件相关的C函数API，可以编写特定的shader 在 GPU上高效完成神经网络计算，当然，这一切都只是开始，听上去要写很多代码。

经过前面几代的铺垫和苹果背地里偷偷摸摸的用功，在2017年，第一代 Core ML （iOS 11）横空出世。现在，对于iOS 开发者来说，Shader都不用写了，在iOS平台，利用机器学习完成一些识别、分类的任务，变得非常简单。而Core ML 的出现，和之前几代系统的更新离不开关系，苹果官方文档的架构说明了这一点。

Core ML 架构，底层基于 Metal、Accelerate 和 BNNS

Core ML 2

在 2018 年，苹果推出Core ML 2 。主要两方面提升，速度更快，模型体积更小。前者利用新的批量预测方法消除了预处理和取出的操作，将所有数据一次性发给 GPU，利用 GPU Pipeline 将其逐个计算的同时依次取出结果。后者降低原来32位的权重量化成16位、8位甚至4位从而降低模型大小。

通过Batch的方式替代Loop，提高速度

对原来32位权重的模型进行量化，在效果和体积之间做一个平衡

Core ML 3

在 2019 年的 Core ML 3 中，增加了各种高级神经网络支持，现在 Core ML 的功能可以拓展到图像、视频、声音和其他富媒体神经网络。

同时支持在本机进行模型训练 (短时间)。同时可以将Keras、 TensorFlow、PyTorch 等等框架的模型转换到 MLMODEL。

更多的模型支持

发音信息、语音检测、声学特性检测(频域)

自然语言文本分析、情绪分析、目录分类

NPU

苹果不止在系统中增加了Core ML 框架，还在iPhone X 开始的处理器芯片上加上专门用于神经网络计算的模块 (Neural network Processing Unit ，以下简称NPU)。可能是在 A11( iPhone 8 ) 上尝到甜头，iPhone XR 上的NPC 直接来到了 5.79 \(mm^{2}\) ，是 A10 上 1.83 \(mm^{2}\) 的 3 倍面积。

iPhone XR 上，core ML 性能对比

MLModel

MLModel 是机器学习模型所有细节的封装。它在整个APP中充当基础数据的角色。后缀是.mlmodel

Core ML 整体

通过xcode可以直接打开.mlmodel 文件查看模型属性。

Core ML 3 支持多种框架的模型导入

2. Create ML 识别阿猫阿狗

介绍

一个非常强大的软件（堪比storyboard），可以完成数据集的训练、测试，并且生成CoreML 模型。Create ML 提供了很多歌模型模板，可以用于物体检测、分类、声音分类、文本分类等等。

另外非常强大的是，Core ML还支持 eGPU 训练。用Mac Mini、MBP 外接显卡就可以加速训练。

Create ML 默认已经包含一些模板

训练

需要提供训练数据集、测试数据集

训练数据集：包含某一些特征
验证数据集：包含在训练数据集中 (需要达到一点数目)
测试数据集：用来测试准确性

使用

推断

    // MARK: - Doing inference
    typealias Prediction = (String, Double)
    
    func predict(pixelBuffer: CVPixelBuffer) {
        // Measure how long it takes to predict a single video frame.
        startTime = CACurrentMediaTime()
        let handler = VNImageRequestHandler(cvPixelBuffer: pixelBuffer)
        try? handler.perform([request])
    }

完成的回调

    func requestDidComplete(request: VNRequest, error: Error?) {
        if let observations = request.results as? [VNClassificationObservation] {
            // The observations appear to be sorted by confidence already, so we
            // take the top and map them to an array of (String, Double) tuples.
            let top5 = observations.prefix(through: 0)
                .map { ($0.identifier, Double($0.confidence)) }
            DispatchQueue.main.async {
                self.show(results: top5)
            }
        }
    }

3. 结果

4. 参考

What’s New in Core ML Part 1
What’s New in Core ML Part 2
iPhone 11 Machine Learning Performance: a Benchmark
What’s new in Core ML 3
WWDC 2018：更快更强的 Core ML 2.0