1 集成学习
1.1 集成学习思想
Bagging(随机森林)
Boosting(AdaBoost、GBDT、XGBoost)
集成学习是机器学习中的一种思想,它通过多个模型的组合形成一个精度更高的模型,参与组合的模型成为弱学习器(基学习器)。训练时,使用训练集依次训练出这些弱学习器,对未知的样本进行预测时,使用这些弱学习器联合进行预测。
1.2 集成学习分类
Bagging:随机森林
Boosting:Adaboost、GBDT、XGBoost、LightGBM
1.2.1 Bagging思想
有放回的抽样(bootstrap抽样)产生不同的训练集,从而训练不同的学习器
通过平权投票、多数表决的方式决定预测结果
弱学习器可以并行训练
Bagging思想图
目标:把下图的圈和方块进行分类
采样不同数据集
训练分类器
平权投票,获取最终结果
1.2.2 Boosting思想
每一个训练器重点关注前一个训练器不足的地方进行训练
通过加权投票的方式,得出预测结果
串行的训练方式
Boosting思想生活中的举例
滚球兽→亚古兽→暴龙兽→机械 ...
前言
AnZhiYu 主题默认支持两种 AI 摘要模式:
Tianli GPT:使用第三方 Tianli 服务
Local 模式:使用文章 Front Matter 中预设的 ai 字段
如果您想使用自己的 AI API(如自建的 OpenAI 兼容服务、Claude API 等),就需要进行自定义配置。本文将详细介绍如何修改主题代码和配置文件,实现自定义 AI 平台的支持。
一、准备工作
1.1 所需环境
Hexo 博客已搭建完成
使用 AnZhiYu 主题
拥有一个可用的 AI API(支持 OpenAI 兼容格式或自定义格式)
1.2 了解 API 格式
在开始之前,您需要了解您的 AI API 的:
API 地址(URL)
请求方法(GET/POST)
请求头格式(如 Authorization)
请求体格式
响应数据格式
本文将以 OpenAI 兼容格式为例进行讲解。
二、修改配置文件
2.1 打开配置文件
编辑 _config.anzhiyu.yml 文件,找到 post_head_ai_description 配置项(通常在文件末尾部分)。
2.2 添加自定义 ...
转载声明:本文转载自 网笙久久的博客 - 使用Docker自建一个Twikoo本地评论系统,原作者:网笙久久
一、关于 Twikoo 的介绍
Twikoo 项目的官网: Twikoo
一个简洁、安全、免费的静态网站评论系统。
二、环境准备
在教程正式开始之前需要准备以下环境。
注意:此教程只适合您在公网拥有一台属于自己的服务器或者本地内网测试环境下使用。
以下是需要的必备条件
一台可公网访问的服务器
一个您自己的域名,例:我的就是 wsjj.top
一份 SSL 证书,确保您的域名可通过 https 访问
三、安装 Docker 容器环境
这里我不再赘述,可以参考我以前写过的教程【容器应用系列教程】容器介绍、Docker 的安装和基本操作。
四、部署 Twikoo 网站评论系统
1. 拉取 Twikoo 的镜像
1docker pull imaegoo/twikoo:latest
2. 运行 Twikoo 镜像
1docker run --name twikoo -e TWIKOO_THROTTLE=1000 -p 8080:8080 -v $ ...
转载声明:本文转载自 CSDN - Hexo:hexo利用hexo-abbrlink插件生成永久链接,原作者:两年半的坤
前言
Hexo 默认的静态 URL 格式是 :year/:month/:day/:title,即按年、月、日、标题的形式生成固定链接。
例如:http://www.xxx.com/2022/11/08/文章标题
默认 URL 格式会产生很多斜杠,百度蜘蛛在抓取网页时会根据网页权重抓取网页,比如最先抓取的首页(一般都是自己的域名,比较简短),因此在链接里不宜出现过多的斜杠,最好不要超过两个。
还有一个问题就是,如果文章的标题使用了中文,经过转码后,URL 会变得特别长,影响用户体验和 SEO 效果。
使用 hexo-abbrlink 插件便可解决以上出现的问题,以往修改标题会导致原始链接失效,使用这个插件后只要不更改文章中的 abbrlink 值,文章的链接就会是持久的。
操作步骤
1. 安装插件
1npm install hexo-abbrlink --save
插件链接:hexo-abbrlink
2. 配置
修改 _config.yml 配置文件:
1 ...
1 线性回归简介
1.1 什么是线性回归
线性回归(Linear Regression)是一种用于建模两个或多个变量之间线性关系的统计方法。它通过拟合一条直线(或超平面)来描述自变量(输入特征)与因变量(输出目标)之间的关联,并可用于预测或分析变量间的影响关系。
假设因变量y与自变量x1,x2,…,xn之间的关系可以用如下线性方程表示:
y=β0+β1x1+β2x2+…+βnxn
β0:截距,模型在自变量全为0时的基准值
β1,β2,…,βn:自变量的系数,表示每个自变量对因变量的影响程度
通过估计这些系数,使模型预测值尽可能接近真实值。
1.1.1 一元线性回归
仅有一个自变量:
1.1.2 多元线性回归
包含多个自变量:
1.2 线性回归应用场景
GDP预测:用历史数据(如投资、消费、出口)建立回归模型,预测GDP增长趋势。
广告效果评估:量化不同渠道广告投入对销售额的影响,优化预算分配。
药物剂量研究:分析药物剂量与患者生理指标(如血压、血糖)之间的关系。
产品质量控制:通过生产参数(温度、压力、原料配比)预测产品性能(如强度、耐久)。
政策效果评估:分析最低工 ...
1 Hexo 数学渲染器插件
1.1 hexo-renderer-marked
hexo-renderer-marked 是 Hexo 默认的渲染器,不支持复杂的数学公式,正是我需要换掉的。
1.2 hexo-renderer-kramed
hexo-renderer-kramed 在默认渲染器的基础上添加了 MathJax 的支持,支持更多的数学公式,与原渲染器有冲突,需要先卸载默认的渲染器再使用它。
12npm uninstall hexo-renderer-marked --save # 先卸载原渲染器npm install hexo-renderer-kramed --save # 安装 hexo-renderer-kramed
配置 Hexo 根目录的配置文件 _config.yml:
12345678kramed: gfm: true pedantic: false sanitize: false tables: true breaks: true smartLists: true smartypants: true
采用这种渲染器对于大多数公式都没有 ...
1 KNN算法(k-近邻算法 K-Nearest Neighbors)
是一种基本的分类与回归算法,属于监督学习算法
1.1 工作原理
计算距离;计算待分类样本跟训练集中每个样本的距离。
选择K个近邻:根据计算的距离,选择距离最近的k个样本。
投票或平均:
分类任务:统计K个近邻各类别的数量,将待分类样本归为数量最多的类别。
回归任务:取K个近邻的平均值作为预测结果。
1.2 关键参数
距离度量方法
K值:K小容易过拟合(容易模拟噪声),K大容易欠拟合(如将K = n,只用计算哪一类最多)
1.3 优缺点:
优点:
简单直观,易于理解和实现
无需训练过程,直接利用训练数据进行预测
缺点:
计算量大,尤其是训练集较大时。
对噪声数据较敏感。
1.4 使用
123456789101112131415161718192021222324252627282930313233343536373839404142434445# 分类from nltk.app.nemo_app import colorsfrom sklearn.neighbors import KNeig ...
前提精要:上一篇实讲 Hexo 博客自动化部署教程,适合想要提升博客维护效率的用户。教程从本地环境验证开始,逐步指导用户完成 SSH 密钥生成、GitHub 仓库配置、工作流文件创建等关键步骤。重点强调了私钥和公钥的正确配置方法,以及如何设置 GitHub Actions 的触发条件和执行环境。教程还提供了完整的 YAML 配置文件示例,用户只需替换相应的仓库地址和用户信息即可直接使用。通过这套方案,用户可以实现“一次推送,自动部署“的便捷体验。
个人纪录如何用腾讯云EdgeOne Pages 进行集成部署 CI(每次提交代码后,自动执行构建、单元测试、静态检查、打包等)、CD(在CI通过后,自动将产物发布到测试/预发/生产环境)
环境准备:
腾讯云账号
已完成之前在 Github Actions 自动部署 Hexo
01. EdgeOne Pages 授权
有两种方式,一种是普通网站,另一种是 Pages
这里选择Git,因为它可以直接关联 git 代码仓库,就无需自己执行 build 的流程,比较方便,使用上文在 hexo 源代码仓库自动进行构建后生成的构建产物仓库
于是选 ...











