标签:数据

python机器学习笔记 ID3决策树算法实战
博客园首页

python机器学习笔记 ID3决策树算法实战

William 4小时前 1浏览 0评论

  前面学习了决策树的算法原理,这里继续对代码进行深入学习,并掌握ID3的算法实践过程。   ID3算法是一种贪心算法,用来构造决策树,ID3算法起源于概念学习系统(CLS),以信息熵的下降速度为选取测试属性的标准,即在每一个节点选取还尚未被用来划分...

前端存储技术
博客园首页

前端存储技术

William 1天前 12浏览 0评论

前言 后端常用数据库做数据存储,譬如MySql、MongoDB,缓存技术存储数据,如Redis、Memcached; 前端存储数据目前常用的是Cookie、Storage、IndexedDB Cookie HTTP Cookie(也叫Web Cook...

性能调优8:分组聚合 - group by
博客园首页

性能调优8:分组聚合 – group by

William 1天前 9浏览 0评论

聚合实际上对数据做分组统计,SQL Server使用两种操作符来实现聚合,流聚合(Stream Aggregation)和哈希聚合(Hash aggration)。流聚合是非阻塞性的,具有流的特性,流聚合操作符;边处理数据,边输出聚合的结果。而哈希聚...

浏览器保存数据的几种方法
博客园首页

浏览器保存数据的几种方法

William 3天前 19浏览 0评论

Web产品中很多时候需要在客户端,即浏览器中保存一些必要的数据。而面临这类需求时,你应当知悉对应的解决方案不仅仅只有一种。 Cookie 这是最早被使用,且至今仍被广泛采用的最简单的浏览器中保存数据方法。 Cookie使用键/值形式存储数据,且数据类...

机器学习之scikit-learn库的使用
博客园首页

机器学习之scikit-learn库的使用

William 6天前 22浏览 0评论

1、scikit-learn库简介 scikit-learn是一个整合了多种常用的机器学习算法的Python库,又简称skLearn。scikit-learn非常易于使用,为我们学习机器学习提供了一个很好的切入点。   2、机器学习基础 机...

Mongodb基础知识笔记
博客园首页

Mongodb基础知识笔记

William 6天前 27浏览 0评论

MongoDB介绍 MongoDB是一个基于分布式文件存储的开源文档数据库。由C++语言编写。旨在为WEB应用提供高性能、高可用性和高伸缩数据存储解决方案。 MongoDB优点 MongoDB使用场景 数据缓存 由于性能很高,MongoDB...

开源数据同步神器——canal
博客园首页

开源数据同步神器——canal

William 6天前 24浏览 0评论

前言 如今大型的IT系统中,都会使用分布式的方式,同时会有非常多的中间件,如redis、消息队列、大数据存储等,但是实际核心的数据存储依然是存储在数据库,作为使用最广泛的数据库,如何将mysql的数据与中间件的数据进行同步,既能确保数据的一致性、及时...