#learn

sklearn的estimator

在sklearn中,估计器(estimator)是一个重要的角色,分类器和回归器都属于estimator。在估计器中有有两个重要的方法是fit和transform。fit方法用于从训练集中学习模型参数transform用学习到的参数转换数据 ...
代码星球 ·2020-11-27

2.1_Scikit-learn数据集

scikit-learn数据集我们将介绍sklearn中的数据集类,模块包括用于加载数据集的实用程序,包括加载和获取流行参考数据集的方法。它还具有一些人工数据生成器。(1)datasets.load_*()获取小规模数据集,数据包含在datasets里(2)datasets.fetch_*()获取大规模数据集,需要从网...
代码星球 ·2020-11-27

Sklearn数据集与机器学习

《统计机器学习》中指出:机器学习=模型+策略+算法。其实机器学习可以表示为:Learning=Representation+Evalution+Optimization。我们就可以将这样的表示和李航老师的说法对应起来。机器学习主要是由三部分组成,即:表示(模型)、评价(策略)和优化(算法)。表示(或者称为:模型):Re...
代码星球 ·2020-11-27

Sklearn与特征工程

“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这句话很好的阐述了数据在机器学习中的重要性。大部分直接拿过来的数据都是特征不明显的、没有经过处理的或者说是存在很多无用的数据,那么需要进行一些特征处理,特征的缩放等等,满足训练数据的要求。我们将初次接触到Scikit-learn这个机器学习库的使用Scikit...
代码星球 ·2020-11-27

【Deep Learning】一、AutoEncoder

DeepLearning第一战:完成:UFLDL教程稀疏自编码器-Exercise:SparseAutoencoderCode:学习到的稀疏参数W1:参考资料:UFLDL教程 稀疏自编码器Autoencoders相关文章阅读:[3]Hinton,G.E.,Osindero,S.,&Teh,Y.(200...
代码星球 ·2020-10-21

Deep Residual Learning for Image Recognition(残差网络)

深度在神经网络中有及其重要的作用,但越深的网络越难训练。随着深度的增加,从训练一开始,梯度消失或梯度爆炸就会阻止收敛,normalizedinitialization和intermediatenormalization能够解决这个问题。但依旧会出现degradationproblem:随着深度的增加,准确率会达到饱和,...

流形学习(manifold learning)综述

原文地址:https://blog.csdn.net/dllian/article/details/7472916假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。它是从观测到的现象中去寻找事物...

迁移学习(Transfer Learning)

原文地址:http://blog.csdn.net/miscclp/article/details/6339456在传统的机器学习的框架下,学习的任务就是在给定充分训练数据的基础上来学习一个分类模型;然后利用这个学习到的模型来对测试文档进行分类与预测。然而,我们看到机器学习算法在当前的Web挖掘研究中存在着一个关键的问...

Sklearn学习笔记

主要记python工具包sklearn的学习内容:链接点击这里。一、Regression& Classification  1.1.GeneralizedLinearModels  1.2.LinearandQuadraticDiscriminantAnalysis  1.3.Kernelridger...
代码星球 ·2020-10-09

基于Deep Learning 的视频识别方法概览

基于DeepLearning的视频识别方法概览 析策@阿里聚安全  深度学习在最近十来年特别火,几乎是带动AI浪潮的最大贡献者。互联网视频在最近几年也特别火,短视频、视频直播等各种新型UGC模式牢牢抓住了用户的消费心里,成为互联网吸金的又一利器。当这两个火碰在一起,会产生什么样的化学反应呢...

Deep learning深度学习的十大开源框架

Google开源了TensorFlow(GitHub),此举在深度学习领域影响巨大,因为Google在人工智能领域的研发成绩斐然,有着雄厚的人才储备,而且Google自己的Gmail和搜索引擎都在使用自行研发的深度学习工具。 对于希望在应用中整合深度学习功能的开发者来说,GitHub上其实还有很多不错的开源项...

Python机器学习(三十三)Sklearn 速查

Scikit-learn是一个开源Python库,它使用统一的接口实现了一系列机器学习、预处理、交叉验证和可视化算法。fromsklearnimportneighbors,datasets,preprocessingfromsklearn.model_selectionimporttrain_test_splitfro...

Python机器学习(三十二)Sklearn 支持向量机

前面章节尝试了K均值聚类模型,准确率并不高。接下来我们尝试一种新方法:支持向量机(SVM)。支持向量机支持向量机(supportvectormachine/SVM),通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。本系列教...

Python机器学习(三十一)Sklearn K均值聚类

到目前为止,我们已经非常深入地了解了数据集,并且把它分成了训练子集与测试子集。接下来,我们将使用聚类方法训练一个模型,然后使用该模型来预测测试子集的标签,最后评估该模型的性能。聚类(clustering)是在一组未标记的数据中,将相似的数据(点)归到同一个类别中的方法。聚类与分类的最大不同在于分类的目标事先已知,而聚类...

Python机器学习(三十)Sklearn 预处理数据

前面章节中,我们首先加载数据,接着查看数据集的基本信息,然后可视化数据进一步查看数据集信息。接下来,我们开始处理数据,但这之前,通常需要预处理数据。大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进...
首页上一页...23456...下一页尾页