今天学习的内容包括:
试图对比着,从人类的学习中理解,机器学习。
1.从一定的样本资料。(从大人指给你看,这只是猫这只是狗) 2.经过大脑的学习,归纳,整理,总结(观察特征并分析总结记住) 3.到形成自己的知识,和经验。(明白了,这样的是狗,这样的是猫) 4.再遇到类似的问题,从而使大脑在遇到类似的问题,能快速做出反应。
1.大量的学习资料(猫狗照片) 2.通过算法建立模型 3.输入新资料,判断,输出结果
只需要少量样本资料(例如几只猫和几只狗的照片),就能非常准确识别。
但是判断的效率比较低
需要大量样本才能准确识别。
判断效率快,能快速处理大量新样本
数据整体——数据集(data set)
每一行数据——一个样本(sample)
每一列数据——一个特征(feature)
以左上角为坐标系,向下为x轴(i,列,特征索引),向右为y轴(j,行,数据索引)
X为矩阵(通常矩阵为大写)
y为向量(向量为小写,约定俗成)
1.判断猫或狗,判断1或0 2.判断是不是垃圾邮件 3.判断有没有肿瘤
1.数字识别 2.图像识别 3.人脸识别 4.判断患肿瘤的大小
1.房屋价格 2.股票价格预测 3.销售额预测
监督学习;非监督学习;半监督学习;批量学习;在线学习
我们给算法一个数据集,从标记的训练数据来推断一个功能的机器学习任务。
在无监督学习中数据无任何标签,或相同标签的数据,交给机器来识别其中的结构,可以将数据进行分类。(聚类分析) 对数据进行降维处理(压缩特征,删除特征) 异常检测(分类之后,有几个点不合群)
一部分数据有标记或者答案,另一部分数据没有 通常先使用无监督对数据进行预处理,分类,然后使用监督学习进行预测
(在数据,环境变化不那么快的时候使用,定期进行批量学习来适应环境) 收集学习资料, 通过算法创建模型(模型不变) 模型投入使用
(新的数据有可能不是正常的数据,或者不合适的数据,判断异常数据进行加强监控) 收集学习资料, 通过算法创建模型(模型优化) 模型投入使用 通过预测值与实际值来改进模型
人工智能>>机器学习算法>>深度学习
机器学习算法只是人工智能领域中解决问题的一种方法。
人工智能还包含搜索算法,等等其他算法
事实上,机器算法中某些底层算法(如梯度下降)就属于搜索算法
请多多涉略不同内容,切勿孤立地学习
机器学习比起人脑需要更大量的数据来进行学习,但是学习之后进行判断的效率很高,近年来机器学习,深度学习的兴起,我想离不开可以大量获取的数据,和计算机算力的提升,
关于机器学习,我认为是从大量数据集中学习经验,来解决某一个任务,并通过一种衡量其准确与否的度量,来测量计算机在任务中的表现,然后提高经验,从而更好地用准确的经验来完成任务
今天第一次学习,学习了2小时,是在看完吴恩达教授的教学视屏之后,机器学习的第二站,希望也能收获满满