基于 Python 全库扫描敏感词

简介 敏感时期,新接到了个敏感词列表,要求把线上数据全扫一下,正常按业务逻辑挨个处理表处理字段还是相当费劲的,所以改了下策略,不如直接扫特定的库,先查库里有啥表,再挨个表遍历数据,如果数据的某个字段是

阅读全文

基于 BeeGo 文件直传七牛云

简介 beego 是一个快速开发 Go 应用的 HTTP 框架,比较适合用来快速开发轻量小规模的 API、Web 及后端服务等应用。 七牛云是一个比较常用对象存储服务,附带 10G 的 CDN 流量,对个人用户中小企业相当友好。 本文就

阅读全文

[PPT] 机器学习基础分类整理

通用步骤 选择数据:将数据分成三组:训练数据、验证数据和测试数据 数据建模:使用训练数据来构建使用相关特征的模型特征工程 训练模型:使用验证数据来修正模型,对算法模型进行微调 测试模型:使用测试数据验证准

阅读全文

WSL on Windows Server 2016

激活 WSL 在正式安装前需要先激活 WSL 选项并 重启,直接打开 PowerShell 执行以下命令: Enable-WindowsOptionalFeature -Online -FeatureName Microsoft-Windows-Subsystem-Linux 下载 下载一个合适的版本,如果需

阅读全文

PhantomJS 继任者之 CDP

做过爬虫的对 phantomjs 肯定也不陌生了,稳坐爬虫界第一大杀器宝座好多年了。它提供了整套的 js 运行环境,基本可以认为浏览器能看到的用它就能抓。 关于 Chrome HeadLess 但毕竟开发者精力有限,前端又是推陈出新

阅读全文