第757章流形学习_学霸的军工科研系统

第757章流形学习 (第1/2页)

姚梦娜提出的这个问题，对于常浩南来说，不难理解。
　　
　　只是很难解决。
　　
　　真要说起来的话，这涉及到文本挖掘、数据可视化、信息检索、数据挖掘、机器学习乃至人工智能等一系列问题。
　　
　　如果真做到姚梦娜所设想的那样全自动化生产，那就是工业4.0了。
　　
　　在1999年这个时间点上，显然不大现实。
　　
　　但不可能完全实现这一整套东西，并不意味着其中没有可以作为突破口的部分。
　　
　　比如数据挖掘和信息检索，就是千禧年附近很火热的研究方向。
　　
　　其核心目的是从海量数据库和大量繁杂信息中提取出有价值的知识，并进一步提高信息的利用率。
　　
　　实际上，在常浩南重生之前，飞机设计和制造领域已经开始应用这方面的技术，他本人也接触过不少。
　　
　　但当年的他作为一个工科出身的普通技术人员，并没有太多理论功底。
　　
　　而系统，则首先需要构建出一个完整且可行的思路出来。
　　
　　这就导致如今他脑子里空有一大堆名词，但却不知道哪個是破局的关键——
　　
　　实际上，他此时就面临着无法从大量繁杂信息中提取出有价值信息的困境。
　　
　　“信息……”
　　
　　常浩南从旁边扯过一张纸，在纸的最中间写下了两个字。
　　
　　在理想化的模型中，最好是一个数据就可以精确且唯一地描述一个含义。
　　
　　也就是一维数据。
　　
　　小学和中学时候做的应用题，大体上就是这样。
　　
　　实际生活中面临的，其实大多数也是这种问题。
　　
　　而对于稍复杂一些的情况来说，要完全描述一个含义，往往需要一组数据。
　　
　　但与此同时，这一组数据又往往不只能描述这一个含义。
　　
　　要想在数学上描述这种一组（多个）数据对应多个含义的现象，就需要将一组数据在不同的维度上进行展开。
　　
　　这是由数学理论推向现实的情况。
　　
　　而反过来，现实中收集到的信息，在多数情况下，本身就是已经展开过的高维数据。
　　
　　而如果想要让计算机处理这些高维数据……
　　
　　常浩南思索半晌，又在纸上写下了三个基本条件：
　　
　　1、对原始高维数据进行压缩，降低原始高维数据的维度，进而节省存储空间，同时也降低高维数据的计算复杂度。
　　
　　2、消除，或者至少降低隐藏在原始高维数据中的噪声。
　　
　　3、提取到高质量的数据特征，提升后续的数据表示和分类任务的效果。
　　
　　他在脑子里把这三条内容过了一下，然后试图让系统给出一个结果。
　　
　　没有反应。
　　
　　显然，这并不能被算作是“完整且可行”的思路。
　　
　　……
　　
　　不知不觉间，常浩南就在办公桌前枯坐到了快要吃午饭的时候。
　　
　　仍然没能想出一个很好的思路。
　　
　　直到一阵来自腹部的叫声把它从深思中吵醒。
　　
　　确实有点饿了。
　　
　　姚梦娜看了看纸上的一个名词和三句话，也知道常浩南大概是没什么思路，干脆站起身道：
　　
　　“要不先去吃个饭？”
　　
　　“也好。”
　　
　　常浩南不是那种死钻牛角尖的人。
　　
　　更何况数学这种东西，光靠俺寻思是寻思不出个一二三的。
　　
　　没有灵感，说啥都没用。
　　
　　不如先放松一下，换个思路。
　　
　　十五分钟后，三人（连同朱雅丹）已经围坐在了食堂二层的一个圆桌旁边。
　　
　　这里算是个点餐制的小灶，价格比下面的大食堂贵一些，加上还要多上一层楼，因此来这里吃饭的人并不算多。
　　
　　倒是旁边的小超市，来来往往的人流量不少。
　　
　　常浩南面前摆着一份热气腾腾的羊汤面，但却并没有急着动筷子，而是出神地看着不远处楼梯口上上下下的人群。
　　
　　90年代这会，方便面还属于非常流行的即食类食品。
　　
　　常浩南读本科那阵子，大家的条件普遍比较差，有闲钱吃得起的人不多。
　　
　　

（本章未完，请点击下一页继续阅读）

零点看书

第757章 流形学习

第757章流形学习