Edit: 暗水印

编辑文章

标题 *

URL 别名 *

内容 * (支持 Markdown 格式)

暗水印

你发的这篇文章把暗水印的来龙去脉讲得很生动，下面我把其中的原理部分单独拎出来，用更系统的结构详细解释一遍。

一、什么是暗水印

暗水印是一种信息隐藏技术，它把一串肉眼看不见的标识数据（比如员工工号、时间戳、设备ID）嵌入到图片、视频、音频甚至文本中。这串数据是图像内容本身的一部分——不是叠在上面的一层，而是融进了像素里。所以无论你截图、旋转、缩放，还是拿手机对着屏幕拍照，只要图像主体还在，水印数据就大概率能被还原出来。

---

二、图片暗水印的两大主流技术原理

文章里提到的那个演示网站，正好展示了两种经典方案，原理其实并不复杂。

1. 空间域水印（LSB算法）

核心思路：直接修改像素颜色的最低有效位。

每个像素的颜色值在计算机里是一个 0~255 的整数，写成二进制就是 8 个比特。比如 180 的二进制是 10110100。

· 最高位（最左边那个 1）一变，颜色会巨变。
· 最低位（最右边那个 0）改成 1，数值从 180 变成 181，亮度变化不到 0.4%，人眼完全无法分辨。

水印嵌入过程：

1. 把要隐藏的信息（如 UID:9527）转成一串二进制数字 010011...。
2. 遍历图片的每个像素，把这串二进制比特依次替换到每个像素颜色值的最低有效位上。

特点：

· 优点：计算极快，肉眼毫无痕迹。
· 缺点：极不耐压缩。截图发微信、存成JPEG，压缩算法会粗暴地丢弃这些“没用”的最低有效位，水印瞬间丢失。

2. 频域水印（DCT变换）

这是企业级暗水印真正在用的技术，也是你拿手机拍屏幕还能被找出来的原因。

核心思路：不在像素本身上动手脚，而是在图片的频率成分里藏信息。

· 低频：大块蓝天、纯色背景——代表图片的整体轮廓。
· 高频：毛发边缘、衣服纹理——代表图片的锐利细节。
· 中频：介于两者之间，既不明显影响观感，又不容易被压缩掉。

水印嵌入过程（以JPEG图片为例）：

1. 把图片切成很多个 8×8 像素的小块。
2. 对每个小块做 DCT变换，把它从“像素值”转换成“频率分布表”。
3. 在选定的中频系数上，按照要隐藏的二进制信息，微调系数的大小。
4. 再把频率表反变换回像素值。

为什么手机翻拍抹不掉？

· 手机对着屏幕拍照时，虽然经过了镜头畸变、摩尔纹干扰、二次压缩，但 DCT 中频系数的强弱关系被保留了下来。
· 企业级暗水印通常嵌入强度极高（相当于在频率上挖了一个很深的坑），并且会配合纠错编码。即使拍照损失了 30% 的数据，剩下的 70% 也足够算法通过校验位把完整的工号算出来。

---

三、AI生成的暗水印：SynthID 原理简析

文章末尾提到的 Gemini SynthID 代表了第三类水印——模型内生水印。

1. 图像水印

与传统的“先出图、后盖章”不同，SynthID 是在 AI 画图的过程中就直接干预生成。

· AI 画图时，模型会在人眼几乎无法察觉的极细微纹理处（比如草地的一片叶子方向、云朵的一丝纹理）注入特定模式。
· 这种模式不是像素值改动，而是视觉语义上的微小倾向，极其鲁棒，截图、拍照、甚至打印后扫描都能检测。

2. 文本水印

这很巧妙，不修改字形，只修改选词逻辑。

· 正常AI写诗会随机选同义词。
· 带水印的AI写诗时，会按照一个预设的数学规则（如哈希值校验）故意在 10% 的用词上选用 B方案 而非 A方案。
· 检测方只要把这段文字跑一遍同样的规则，看命中率是否显著偏离自然概率，就能断定：“这段文字是AI写的，且出自我们家的模型”。

---

四、总结对比

技术类型 藏在哪里 防截图 防拍照 典型应用
LSB 最低位 像素颜色个位数 ❌ 易丢 ❌ 秒没 简单隐写术玩具
DCT 频域 图片频率分布 ✅ 很强 ✅ 极强 公司内网屏幕、机密文件
SynthID 生成模型参数倾向 ✅ 极强 ✅ 极强 鉴别AI生成内容

最后借你文章里那句诗收尾，因为原理讲完再看这句，会更明白它有多准：

指尖轻点处，云端已记名。莫道无人见，暗纹即汝名。

配图 (可多选)

选择新图片文件或拖拽到此处

标签