47. 人工智能和医疗的未来｜医生如何应对不准确的 AI 预测？｜计算机研究跨界到医疗有哪些担忧(嘉宾：Yannan)

Watch it on Youtube. Or listen on your favortie podcast app.

Show note

在医疗行业里，运用 Deep Learning 有哪些挑战？当医生拿到不准确 ❌ 的预测结果时，将怎么影响医疗方案的制定。医疗 AI 🤖️ 里有哪些 low hanging fruit 是大家可以尝试的呢？Medical Journal 里审论文时经常看见哪些计算机从业人员常犯的错误？为什么非洲 🌍 很有可能是第一个实现医疗 AI 落地的地区？

嘉宾： Yannan 美国住院医师

制作/主持：李丁泽宇

字幕: Pengdi Zhang

文字后期整理：郭煜

Full transcript text

李丁：欢迎来到第二部分的关于医疗的这期李丁聊天室的节目。上一期我们聊了在美国行医的一些经历，今天的 Yannan 接着跟我们聊她对于医疗和人工智能 AI 的一些探讨的点。我对 AI 比较了解因为我从事计算机行业，那我对医疗其实不是特别了解，Yannan 可以简单跟大家介绍一下你的医疗方面的这些背景吗？

Yannan：好呀，其实我跟你相反我对医疗了解更多，对 AI 嘛就是一个入门汉的这么一个水平。在上一期我提到我在国内医学院毕业之后，我来美国做过几年科研。一开始做科研的时候，我其实没有接触到 AI，但是我的第一个 PI，他有一个小的 PI 他是一个 CS 教授，他有一些医疗的项目。一开始是 Machine Learning，逐渐过渡到 Deep Learning 的这么一些 Projects，我当时就 involve 了，那时候我也不会写 code，我就跟一些 CS 的同学合作这样子，告诉他们我们的方法学，他们用这些 tool 来实现我的这个操作的 research。之后呢，我就换到了另一个 Postdoc 的 position，那个 position 就更加 hardcore 一些，而我就要自己 code 我的这个 AI Model 啊，自己设计自己的实验呢。总体来说就比较 hardcore 一些，所以说基本上我的这个经历都是基于我那一段 Postdoc 时期对 AI 和 Deep Learning 的一个接触。

李丁：那你用的 Deep Learning framework 是哪个呢？

Yannan：是这样，我一开始接手的时候那是之前有一个 PhD 的 EE 的前辈已经写好这个框架了，他是用了 Python 的 TensorFlow，所以我当时就是顺着这个 TensorFlow 继续写。我当时中间也有想我要转 PyTorch 因为我们其他的一些 CS 同学都是用 PyTorch，因为学习成本比较高，很多时候我就是专注在我能够实现我要做的东西，不管是在什么架构里面就完了。所以说很多时候我就回收利用我的所有 code，所以基本上我都是在用 TensorFlow。

李丁：但你之前有过这种学计算机编程的经历吗？还是说你就在接触这种任务之后，开始边学边做边学种感觉呢？

Yannan：唯一的接触就是我大学本科时期学过一个学期的 C 语言，that's it。然后中间就再也没有 coding 过，所以说我当时是开始 Postdoc 的时候，我大概花了三个月的时间，把 Python 从零基础到会改那个 model。大概这三个月的时间，当时有上一些 Andrew Ng 的这个课啊这些，所以对这个稍微有些了解，但是基本上后期的学习都是 problem solving based，以及 Google，所有都是 Google 教的。

李丁：那已经得到了这个 CS 的精髓，那就是 Google 加 StackOverflow 就是精髓。

Yannan：我 StackOverflow 用的可不好了都不能点赞，就只能看看别人的回答。

李丁：对那个是有一个 rank system，就你得有很多 contribution 才能 upvote。你提到了你用的是这种的 TensorFlow 啊 Deep Learning library，所以我想象的应该是一个这种有很多数据量然后需要进行 training，然后得到一个模型的。你能分享一下说你做的是一个大概什么样的，input 什么，output 什么呢？

Yannan：我们做的这个研究基本上都是 image based，我们的 input 其实是一个 stroke imaging 的 MRI 或者是 CT 的 image。那么就可以想象这个其实是一个非常大的一个数据量，每个的 resolution 大概是 512 x 512，比如说 30 层左右，大概是这么一个 size。

李丁：Stroke image 是什么东西？

Yannan：就是你人得的这个中风，人中风了之后，如果说你在到达医院的时间比较短的话，医院会给你扫描这个大脑的一个影像，有可能是 CT 的成像有可能是 MRI 的成像。在我做 research 的那个 center 呢，他们是比较倾向于 MRI 的这个成像。

李丁：对，MRI 会得到你刚才说的一个 512 x 512 x 30 的一个 data 是吗？

Yannan：对，大概是这么一个 data。他这个 MRI 上面显示的其实是你的大脑的哪一片区域已经中风了，我们可以看出来，还有一些内容是可以显示出来，大脑哪片区域可能会中风，如果说你不给他治疗的话，他那块区域就会相继的死掉那样子。我们的这个 research 的目的呢，是预测最后他这个大脑会有多少的组织会死，就是最终的中风的这个 size 和 location 是在什么地方。相当于是你要用一个 baseline 的 image 的 information to predict future 的 information，预测这个疾病的 progression，是一个 image to image transformation，所以说我们使用的是 UNet 这个 tructure，基本上是一个 segmentation task，是一个 future 的 image 的 segment。

李丁：你们有患者在中风前的图片和他中风之后的图片，然后就可以用之前的预测之后的是吗？

Yannan：类似于这个人中风之后，比如说六小时的图片，去预测中风之后七天的图片。

李丁：为什么要这样预测呢？

Yannan：因为中风的时候六个小时，其实就是刚刚开始没多久，它大概要到 24 小时才到一个 maximum，所以说你六个小时看到图片，它还会继续的一个 progression，然后七天的话差不多它就不会再继续进展，相当于是一个 final 的 result。

李丁：所以给医生一个相当于提前的 preview，看一看会怎么样可以提早开始治疗方案什么。

Yannan：对，这个最终目的其实是帮助医生制定治疗方案，因为说其实中间还有一些更多的变量在里面，就是你 stroke 的 progression，不光是一个 disease 的 natural progression，他还有一些根据你选择的不同的治疗方案，你可以改变这个疾病的进程，我们也会把这些 factor 放在这个模型里面，我们最终要得出的一个模型的 application。一个病人来了，你有这个 image，我有 option 1，我做这个治疗最后的结果是这样子；option 2 是这个治疗最后结果是这样子；比如说还有不治疗，最后结果是那样子。你要比较这个，比如说不治疗跟治疗之间有多大差异，如果说没有很大差异的话，就没有必要去治疗它，因为治疗本身也有副作用。

李丁：了解。你比较两种不同的，在两种不同的条件下的这个最后的 result 来制定你的医疗决策，这个这样我们也都知道 CNN 或者 Deep Learning 这种的方法他好像有不准的时候，那如果医生看了一个不准的结果，他做出了一个预测那会对患者有什么样的影响呢？

Yannan：就我感觉这个其实是相对而言，因为目前我们有的，我们只能跟目前我们所有 tool 进行比较，最终目的不是百分之百准确，我们知道这很难，也是几乎不可能在现阶段实现。所以说我们的目的是只要你比现在现阶段我们临床在使用的方案好，那么这个 Deep Learning 就是 OK 的。我们现在临床的使用方案，其实是用一些很简单的统计学模型得出的结论，简单的线性模型得到的 cutoff，在 image 上面画一个 cutoff 范围，那么我觉得这个 cutoff 的范围就是未来的大小。所以说只要我们能够证明我们这个 Deep Learning 预测的范围大小比我们用这个最简单的 cutoff 的方式更加准确就可以了。关于就是具体做医疗决策的话，这些 image 都是一个辅助的作用，如果说这个医生有强烈的 suspicion，这个 data 有问题或者这个预测不符合我的逻辑预期，或者说是我觉得这个病人尽管如此也不适合接受治疗，他依然可以做出他相应的治疗决策。我们并不是说这个 image 的预测就要 drive 医生所有的 decision。

李丁：只要比现在的 baseline 要好，那肯定是从患者讲的时候肯定是好一点的嘛。但是把这个真正能够用到临床上面去，肯定我感觉应该总有一些合规合法方面的，这个的话证明是很简单的吗？还是说它这个流程也就非常繁琐，才能够真正的用到医院里面去的？

Yannan：我感觉这就是学术界和工业界的一个断层吧。因为如果说你要应用到这个临床当中，你要大范围的应用，你要注册有公司吧，然后通过 FDA 认证，所以这个在 regulation 上是比较复杂的部分。如果说我们在某个 center 做的研究，其实是可以局部的应用到我们自己这个 center 上，有时候是可以 work，就可能通过医院的叫 IRB 审查的 board 就可以了。如果小范围的应用理论上讲还是可行的，但是如果说大范围的应用估计就得开公司。

李丁：就是其实这个是给医生作为一个辅助参考的，就他看了这个数据，他可以选择用可以选择不用，然后他可以知道这个系统有什么样的 limitation，他就可以自己做出决策。那在我看来，医生的一个很大的作用是可以看懂我看不懂的一些图表，看懂一些我看不懂的数据了。那其实这方面就比较客观，或者说比较纯 data driven 的方法，其实我感觉是算法可以做得很好的。就比如你刚才举的这个中风的 imaging list example 是非常好的，那你觉得还有什么样的 task 是对医生他们来说即难而且可能他们也不 enjoy 的这种过程有吗？

Yannan：有，这种其实很多。Low-hanging fruit 已经在做了，就比方说很多时候很多工作是一些就是那种 labor intensive，并不 enjoy 这个过程。你比如说，有一个常见的工作是有的病人有那个脑转移，肿瘤的脑转移，放疗科的医生就需要制定这个放疗的方案，放疗方案的第一步你就要先找到这些转移灶在什么地方他们有多大，你的放疗范围要包括这些区域。那很多时候放射科的一个 task 就是把一个肿瘤一层层地描出来，磁共振的那个影像就不再是 512 x 512 x 30，可能是 512 x 512 x 100~200，这样子相当于你要画至少五六十层的，你要把这个肿瘤的边界画出来那这其实是一个非常 labor intensive，很多相关的工作就是直接就做 segmentation，自动的 segmentation 就可以帮助到他们减少这个工作量。

李丁：可以说画个几帧，让其他自动预测出来，他就可以不用每一帧每次的画了。

Yannan：自动 detection 到，最后医生稍微修正一下他画的不对的地方就可以了。

李丁：这个的确是，包括我们公司有很多视频编辑软件，各种 masking 就 exactly 做这种事情的。

Yannan：对对，就是它那个语义的 segmentation 其实还不是最 cutting edge 的。

李丁：所谓的这种 AI 方面的 application，你觉得会有哪些方面是会去 reimagine 整个从医这个行业的呢？

Yannan：感觉这挺好的问题，我之前做过一个 presentation 是我个人认为的比较 general 的 AI 在医疗当中应用的一个层级吧。最 low-hanging fruit 就是取代一些很简单的重复性的劳动；然后稍微复杂一点的 AI 的 application 可能是一个 standardize 所有的主观评价，比方说在影像上面，很多医生需要给他评一个分，这个分他虽然说是相对客观的一个标准，但是你给出这个分还是一个的主观的过程，你需要评估这个区域受影响那个区域受影响，所以最后的分比如说是两分这样子，然后如果说你用 AI 的话你就可以减少人和人之间的这个 variability，你在得到这个分的时候，他这个 driven 的过程永远都是一个 standardize，这样子的不同的中心你得到的分都是一样，这是第二个 level，就是你 standardize 主观的这些评估；然后第三个 level，我觉得是改进目前的主观评估，让他有更好的预测愈后的一个功能，这个主观评估的目的其实是为了预测说这个人两分，所以他愈后比较好，那个人五分，所以他的愈后比较差，就是主要其实是为了分级这个病人，那如果说我们能够通过 AI 改善这个分级，让他这个两分就 sensitivity 和 specificity 能够更加的高，那这个评估系统是一个 improvement；最后的 improvement 就是让 AI 产生新的 scientific knowledge，比方说你要用一些这个 explainable AI 啊，或者说你能够理解 AI 为什么做这个 decision，为什么这个 decision 比用传统的 statistics 的 moel 要好，或者说为什么比这些普通的 level 的医生的水平要高。如果能够解释然后发现比如说，图像中或者数据当中我们之前没有意识到的一些细微的变化，对这个决策产生关键影响的话，那其实对未来就是人类对这个疾病对这个诊疗的认识能够更加深入一些，因为我觉得现在的很大的 limitation 就是我们知道 AI 能 work 但是为什么 work 那么好，它对科学究竟有没有帮助其实是不太清楚的。

李丁：对你刚才提到的这个 explainable AI，其实在我们做的这个 research 里面很强调的一点也就是 interpretable，explainable，具体在医疗 AI 里面是什么样的 explainable 呢？

Yannan：这个其实我只有具体的例子可能更加的容易说明一下。就举个例子吧，比方说肺炎的病人 X 光片，有的病人特别严重死了，有的病人不严重好了，那么在这个影像上肯定是有一些区别的。那我们比如说我们现在医生的认知是，这个影像如果看起来肺炎累积的范围非常大，那么这个病人大概不会好；有的肺炎比如它累积范围小，我们觉得还会好。如果说 AI 能够做出更准确的判断，并且基于除了大小以外其他的信息比如说它的 texture，用人能够理解的这种 texture，比如说它看起来像是蜂窝状的 versus 它这个肺整个都实变了，这种在影像上的区别，如果是对这个愈后有特别大的启示作用的话，可能也是有用的。影像比较抽象，如果在更具体一些比方说，患者的血压血糖好了，比如你有 ICU 患者监测的血压血糖，就是说每一个小时有一个 data，其实有非常大的 data，这个人比如说七天住院的时间，你要判断最后那第七天的时候，住院的结果到底好还是不好，那这个时候我们可以知道他血压高肯定不好的，血压低肯定也不好，那肯定 maintain 在一个比较正常的 level 比较好。但如果说 AI 认为比如说你这个血压幅度变化特别大，不好，或者说血压在某一个契合点，它发生了某种状态的变化，特别不好，那么就增加了我们这个 knowledge，大概就是这么一个意思。就是我们知道很多时候哪些因素跟这个患者最后愈后好不好有关系，但是如果说 AI 能够帮助我们更深入的理解这些 feature 的话就会有用。

李丁：对，我觉得你说的这个 in general 的这种 pattern matching 或者 pattern finding 是 AI 啊，包括 CNN，包括很多现在最近的这些比如说 attention mechanism，可以知道这个 network 到底在看什么东西吗？其实像你刚说到的到底这个肺的大小呢，还是说某个形状是蜂窝，还有什么其他形状的，这种其实是我感觉至少在庞大的数据量面前，AI 应该肯定是比较厉害的。至于它找出来这些 signal 靠不靠谱那肯定需要医学专业来判断说，比如这个形状到底医学有没有解释，如果有解释它固然好相当于是 AI 发现了 rediscover 这个东西，如果现在医学还没有发现这个情况本来也没有关系的，那说不定 AI 发现了一个全新的医学领域，或者说 AI 的 glitch，它只是 take 一个 shortcut，这个病跟这个患者的这个症状没有关系，只是 AI 的一个错误而已。

Yannan：很多时候我们很难去解释，现在的这个数据量来说，其实医疗数据量太小了，所以说一是很难发现这种 pattern，二是你也是很难解释说这个 pattern 到底跟这个有没有关系不确定。之前我读过一篇 paper 就是说他们看那个应该是 ResNet 150 之类的，它就是每一个 node 它到底 detect 你说它是云的形状还是山的形状，甚至有具体的 neuron 就让他们在执行的这个具体的 task，如果说能够运用这些，就已知的这些 task 到这些医学影像上的话，你可能就能够更加 instead of 云或者山，你 detect 的是某种具体的 texture，这样子稍微更加能够理解的非常具体。因为我感觉就是如果纯粹的是 training from scratch，比如说它 generate 出来的一些东西，根本就不知道它干的是什么。

李丁：我还有两个问题想问你的，一个是你刚才提到的 CNN，那你在跟你的这个研究中有用到其他一些，也是最近越来越火的一些这种 AI 的概念比如说 GAN，或者说什么 transformer 啊，或者这种类型的 AI 框架吗？

Yannan：就是我们会有 discuss 的，但是我自己是不会写那些模型，就目前我没有自己写过这些模型。但是我们有那个合作的 CS 的同学，他们会写这些模型然后用在这个项目。我们实验室会有些项目会用到 GAN，还有 transformer，somehow 我也不知道为什么，我们的项目用在 transformer 上面效果并不是很好，很多时候我也不是很清楚，就是有时候他汇报的可能更有用的 network 并没有在医疗上面有特别大的作用。

李丁：对对对，至于哪种问题哪种 dataset 用哪一种结构最好，这个在 CS 业界的研究也是一个无解的话题。有的人说是数据量大小直接相关，比如说 transformer 可能需要比 CNN 大十倍一百倍甚至更多数量级的这种数据才能让 transformer 的这种效果表现出来。有的人又说可能是 dataset annotation 的准确性啊或者是就是这种，反正变量特别多没有一个定数。所以现在一般的通法就是说把一个数据集的各种结构都跑一遍哪个好就用哪个。

Yannan：暴力解法。

李丁：对，暴力解法都是比较傻的一个方法。

Yannan：医疗方面我们倾向于不这么做，一般主要是为了证明一个 concept，只要比现在好其实我证明一个 concept 就 OK 了。因为你去 extensive test，过了五年你又有新的很多 model pop 出来，如果不是做 industrial 的话，个人感觉没有太大必要，如果我们发的是 medical journal。

李丁：对，如果这样它有点像灌水了，同样的 dataset 你拿各个结构各跑各发一篇，在 CS 也不这样做了。再比如说我们假设我如果现在想做一个 CS 从业者，我想去做一个这种 CS 跟另外一个领域这种交叉行业的一个话题的话，那我可能就会说那我先把所有的网络结构都试一遍，因为我不想有一个 assumption，我不想说 CNN 最好或者什么做的最好，我想全试一遍，然后再选择最好的就往前走了，但我也没有什么科学性我也不知道哪个 work 的最好。第二个我想跟你讨论就是说，最近 DeepMind 还是，应该是 DeepMind 做了什么 AlphaFold 还是各种，就是这种关于医疗方面的这种用 AI 做的对药物的发现啊或者说对这种医疗 in general 会有什么样的一些影响吗你认为？

Yannan：所以说这个 AlphaFold 就是那个 detect 蛋白质结构，就是 generate 蛋白质，我看到过新闻我觉得这个挺酷的。我个人觉得那个还是挺有意思的，我不再做这些基础医疗，但是光从我看新闻的话我感觉还蛮 exciting 的。因为很多时候你需要，我记得我小时候玩过一个蛋白质折叠的游戏，其实类似于你就是那个机器帮人家跑，是可以发现更稳定的结构，我不是很确定我个人感觉还蛮 exciting 的。只是我在想这些东西能不能用到比如说我们临床的领域这个其实是我不太确定。很多时候就是找一些交叉点能够突然地用到我们这些领域上的我觉得就会觉得非常的棒。

李丁：怎么样叫更临床呢？

Yannan：蛋白质结构这个其实是一个非常非常基础生物科学这个方面的问题，临床的话这是我们要回答，我们相当于基本上是终端使用者，所有东西的终端使用者。我们是希望能够解决一些比如说 AI 能不能够实际的帮助病人改善，直接的改善他们的这个愈后结果，这是我们经常需要的。是这样说，我们希望 AI 能够做一个 better choice，就比现在我们临床所用的工具更好的 choice，我们有这些 data，怎么样的模型能够帮助我们去做更好的预测，预测因为在很多 project 我做的过程当中有一些成功了，有一些我怎么做我都没觉得这个结果有多 impress 我，所以说就是很多时候还在一个寻找的过程当中。

李丁：这个有意思对，你刚才提到的这种临床让我想到就是说，其实 AI 或者计算机其实 in general 他其实是个很宽泛的一个概念嘛，就是当我们讨论 AI 的时候可能大家媒体里面的报道会 focus 在深度学习，Deep Learning 这些东西，但实际上，计算机科学它其实在各方面都会对医疗对其他领域有影响。我之前做过的一个就是关于 3D 打印啊，关于这种 computational fabrication，怎么样进行 personalized 这种设计的，就比如说之前如果说可以扫出你的骨骼模型，可以帮你 custom 3D print a bone，或者说你的头盖骨破了，可以给你打一个完美 match 的贴上去这样子，其实也是一种发明那种临床应用，因为那就是相当于基础科学比较少了，因为它其实就是把它完全应用上来的一个一个案例嘛。

Yannan：对对对，这个其实现在应用还挺多的，这个 3D 打印这方面，对于这个手术的这个 planning，还有手术医生的练习啊其实都非常有帮助。

李丁：对，因为我之前我的那个学校，在哥大那会儿的时候做 3D 打印的项目的时候，借用的一个 3D 打印机，因为我们的项目需要用很高精度的，我用的就是我们那个 BioMedical Engineering，就是 BME department 一个那种好像是他们用于牙科来做一些 engineering 的一个打印机的精度特别高然后材料也特别硬什么的。

Yannan：对，可以打假牙什么的。

李丁：是，你对这个 AI 加医这个，因为这个方案，我感觉是一个不可逆的吧，因为历史车轮始终是往前走，大家都想要跟更智能的一个东西，那你对他们会有什么样的 concern 呢？

Yannan：其实我觉得 concern 的话，因为我做这个 medical journal 的 peer reviewer，我就会经常看到一些实验设计，就不是非常严格的医疗设计，这种情况呢他们就会 claim 比如说我这个达到了准确度 98% 之类的这样子的，我觉得会有不严谨的医疗实验设计，导致大家对这个 AI 的信心过于 premature 的高了，所以这是一个担心。另外的话我感觉是有个别的应用，把比方说对于这种 CycleGAN 去 generate image 有可能会有 hallucination 的存在，就是这种会不会引起就是医疗决策就受到影响，因为很多时候如果说你完全产生一个新的 image 让医生完全 base 在这个新的 image 上做临床诊断的话其实是会引起错误的诊断。

李丁：就比如说特别是说计算机行业的人去，往别的地方跨界的时候，很多时候因为我们不了解其他行业的一些 common practice，所以说我们就会想当然的让我们，比如说 CS 里面要做些 user study，我们就把一样的逻辑，因为在 CS 我们做 user study 有的时候，特别大学里面是需要 IRB 的，所以我们就想说那我们也有一个所谓的这个过程，让我们想当然的把这一样的过程跨界到别的领域，有的时候是物理或者说化学，或者是医疗什么的，其实这个过程中可能就并不符合当前这个领域里面的一些期待。

Yannan：是的这个其实挺明显的在这个医疗，特别是医学影像这方面，当然我觉得随着大家对这一块更加的熟悉，那以后产生的这个 research 更加多的高质量的 research 的出现。现在比较常见的一个问题就是我经常发现很多可能很多 CS 人都不会意识到，就是在 CS 当中，你在做 image 的 recognition，你都直接把这个数字压缩到 0 到 1 之间，因为 image 就是一个 RGB 的 scale，就是 0 到 256 之间，所以说压到 0 到 1 之间非常的 make sense，也不存在什么大问题。但是在医疗的影像当中比如说 CT，它这个 image 是负比如说负 3000 到正 3000 这么一个过程，你把它压到 0 到 1 之后，你就 loss 了很多的 information，因为真正有用的对于计算机我们 recognition 的 information 大概是在零到一百之间，但是你把它作为一个六千的 range 压缩到 0 到 1 之间，只能看到一点点而已了，就最多是最低的和最高，中间那些全部都是没有了。所以就是知道你要做的医疗问题到底是什么，然后针对它来进行 image 的 preprocessing 是很重要的。还有人会把这个 image 的影像先 convert 成 JPG，然后变成 0 到 256，然后再做成 0 到 1 这也是常见，这个也是我个人觉得是不能够被认可的，也是类似的一个原因，每个 image 它这个范围都不一样的，强行的压缩也是不行的。

李丁：我刚才觉得这个负 3000 到正 3000 这一点非常的有意思，因为其实这相当于是一个纯粹从负向到正向压到 0 到 1，这个过程本身没有什么错误因为对吧，这个只是说因为做研究的人没有 domain expertise，他不会知道医生看的时候是看哪个 range，他只是想说那我把它压缩到我的算法能够接受的那个区间就可以了，但它其实可能更应该做的是，把低于 0 的丢掉，把大于 100 的丢掉，然后取中间的部分这样子，network 可能会做得更好。

Yannan：对对对。

李丁：对，这种情况我感觉应该在未来会出现的越来越少了。因为跨界会很常见，我也知道很多计算机的教授会跟医学院教授合作，如果你两边各有这种专家出现的话，那应该不会有这种低级错误的实现。

Yannan：慢慢的会变好。

李丁：另外一个，你也提到这个 hallucination，这个 CycleGAN 任何概念都是一种 hallucination，这其实就是回到刚才一开始问的那个问题嘛，stroke image 因为你预测七天后他如果不准了怎么样了，这个医生还是有一定的机会调节回来的。如果他感觉这个真的不太靠谱，这个生成的东西那么奇怪我以前完全没有见过，他可以就是停下来思考一下。

Yannan：我们这个问题跟我刚才提到的会有一点不一样，实际的 application 就是会不一样。我的那个 research project，医生还是会有 original input 的 information，他们还是会看的 information，所以他会有一个自我的判断。但是现在 radiology 很常见的 application 就是说你要缩短 MRI 的扫描时间，现在 MRI 的扫描时间比较长，他采样的时间比如说在十到二十分钟，甚至有的一个小时左右的病人很难忍受，那这个时候他们就在试试看能不能减少采集的样本的量，产生同样质量的 image。其实是一个这样子的一个螺旋型的一个方向，就比如说去掉了百分之五十的 data，这个时候医生能看到的就只有你处理完的数据了，但是医生是不可能看到原始采样数据来得出任何结果，所以说这个时候你采样的数据就是他的一手信息就不行。

李丁：对，这其实非常像计算机里面的 super resolution 嘛，这里有一张低清的图片，你要把它变成是 4k，8k，Nk 的这样子的，那这种情况下如果计算机他认为那里多了一个人头，那就是看到一个人头，但实际上可能只是一个 blob，一个模糊的一个影子而已。

Yannan：对，还有一些 application，比方说 image 本身要 inject contrast，就是要打一个染料进去然后让你的血管或者是某些组织染色，有些 application 就是说让你只打一丢丢染料，这样子可以减少染料对身体的损害，还有一些 application 干脆不打染料，然后用 AI 来预测染料之后的结果是什么样子的。这种也会产生 hellusenation，如果产生不正确的 hellusenation，那就可能结果就是良性肿瘤还是恶性的这样的。

李丁：我们讨论了这些你的 concern，但我感觉你从事这方面的研究，你肯定是多少是有一点乐观的，你觉得那接下来这个方向会有哪些前进的一些可能性呢？

Yannan：我觉得总体现在这个领域还是朝气蓬勃的发展了，我觉得最重要其实最难的一个点就是医学 data 的获取，我觉得其实在医学实验设计或者大家 idea 方面，我觉得会扩展得越来越快，不管从医学的上游还是走到医学的最终端的应用，都会有非常多的 research 去做。随着模型的越来越多，还有两个学科的交融，我觉得最终这个领域会越来越好。唯一的 concern 其实就是说对于资本对这个领域的 interest 的一个程度，还有就是这个数据到底能够 pull 到什么样的程度，其实我是非常能够期待。我觉得未来一个很大的 steps，是能够做出 medical 的 ImageNet，这个其实是非常大的一个 step，如果我们能够做出就哪怕是 image 而已的话，这都是会有很大的进步作用。

李丁：对，之前的，上一期你也提到了，就是说你在未来也会考虑去做大学里面的这种医生，这条职业道路了。如果走那样子的道路，其实你就有这个可能性去收集 data 做这种 medical ImageNet。

Yannan：这个感觉还是很 challenging 了，但是未来总会，我觉得未来最终，所有人的最终 path 一定是你自己产生的小作坊我觉得是产生不了实质性的特别大的推动作用。

李丁：所有的这种深度学习方面的一个 argument 就是说靠海量的 data 来看到常人看不到的东西,，那么这一个医生一辈子看到的 CT 不如计算机一天看到的多，那你这个计算机算法变得越来越聪明，data 越来越多，所以理论上一定是更好的一个未来。

Yannan：对对对，很多 steps 但是总体我觉得还是一个乐观态度。

李丁：是，跟 Yannan 这个 AI 的讨论这集好像比较 open ended，我们也没有什么特别明确的结论，主要就是跟大家讨论一下看看，各位听众有没有一些对于医疗对于 AI 方面的一些看法。

Yannan：也很开心能够和大家一起讨论。

李丁：这期结束前 Yannan 有什么要跟大家最后分享的吗？

Yannan：我感觉总体来说除了 AI 对科学本身的发展，还想补充一下 AI 可能对普通大众的一个影响。我觉得最终还是会让医学至少希望是会让医学变得更 accessible，让世界每一个角落比如说第三世界国家能够得到同等质量的医疗，所以这个也是一个很有意思的 project。但是因为不在这个 research 的 scope，所以说我们很少会去涉及到，但是即使是 AI 能够 perform 很一般的医生的那样子 diagnosis 水平的，对很多其他的比较贫困的无法接触到医院的地区的患者也是一个很大的福利。

李丁：其实你说这点有点意思，相当于就是说因为那边就比如说第三世界国家它可能没有一个医生存在，所以说哪怕这个 AI model 它并不能达到百分百的准确率，但已经好过没有医生的状态了。所以说反而这种医疗 AI 第一个在那边落地，而且那边的法律法规可能相对于比较松一点点，可能直接把医疗 AI 拿过去用是可以合规的，所以第一个落地的国家反而可能是没有那么发达的国家。

Yannan：这是我们的预期。

李丁：这个很有意思，那我们的讨论就到这里了，谢谢 Yannan。

Yannan：谢谢李丁。

李丁：我们下期再见，拜拜！

47. 人工智能和医疗的未来 ｜ 医生如何应对不准确的 AI 预测？ ｜ 计算机研究跨界到医疗有哪些担忧(嘉宾：Yannan)

Show note​

Full transcript text​

47. 人工智能和医疗的未来｜医生如何应对不准确的 AI 预测？｜计算机研究跨界到医疗有哪些担忧(嘉宾：Yannan)

Show note

Full transcript text