别再只会用PS加Logo了！聊聊图片、文本、数据库里那些‘看不见’的数字水印（附Python代码示例）

张

张建站

2026/6/1 4:05:34

10分钟阅读

别再只会用PS加Logo了聊聊图片、文本、数据库里那些‘看不见’的数字水印附Python代码示例数字水印技术早已超越了简单的版权标识它正在成为数据安全领域的隐形守护者。想象一下你可以在不改变图片观感的情况下嵌入溯源信息或是在普通文本中隐藏只有特定程序才能识别的身份标记——这种隐形墨水般的特性让数字水印在知识产权保护、数据追踪等场景中展现出独特价值。本文将带你用Python实现三种主流数字水印技术从图像LSB到文本零宽字符再到数据库字段的隐形标记每个方案都附带可直接运行的代码示例。1. 图像水印用Pillow玩转LSB隐写术最低有效位(LSB)算法是图像水印的入门技术其核心思想是利用人眼对像素细微变化不敏感的特性。一个24位RGB像素由红绿蓝三个通道组成每个通道8位取值0-255修改最低位的0/1只会造成±1的颜色值变化——这种差异肉眼根本无法察觉。from PIL import Image def lsb_embed(image_path, watermark_text, output_path): img Image.open(image_path) pixels img.load() # 将水印文本转换为二进制 binary_text .join(format(ord(c), 08b) for c in watermark_text) binary_text 00000000 # 结束标记 if len(binary_text) img.width * img.height * 3: raise ValueError(水印信息超出图像容量) index 0 for x in range(img.width): for y in range(img.height): r, g, b pixels[x, y] # 修改RGB通道的最低有效位 if index len(binary_text): r (r 0xFE) | int(binary_text[index]) index 1 if index len(binary_text): g (g 0xFE) | int(binary_text[index]) index 1 if index len(binary_text): b (b 0xFE) | int(binary_text[index]) index 1 pixels[x, y] (r, g, b) img.save(output_path) # 使用示例 lsb_embed(original.jpg, SECRET2023, watermarked.jpg)提取水印时需要反向操作def lsb_extract(image_path): img Image.open(image_path) pixels img.load() binary_text for x in range(img.width): for y in range(img.height): r, g, b pixels[x, y] binary_text str(r 1) binary_text str(g 1) binary_text str(b 1) # 按8位一组解码 watermark for i in range(0, len(binary_text), 8): byte binary_text[i:i8] if byte 00000000: break watermark chr(int(byte, 2)) return watermarkLSB技术的优缺点对比特性优势局限性隐蔽性人眼无法察觉频谱分析可能检测到容量每像素可存3bit大图才能存长文本鲁棒性无压缩/滤波会破坏水印计算效率O(n)时间复杂度需遍历所有像素提示LSB适合需要快速实现且对鲁棒性要求不高的场景如内部文档标记。对于重要版权保护建议结合后文的DCT/DWT变换域技术。2. 文本水印零宽字符的隐形魔法零宽字符(Zero-Width Characters)是Unicode中的特殊存在它们不占显示宽度却可以携带信息。常见的零宽字符包括U200B (零宽度空格)U200C (零宽度非连接符)U200D (零宽度连接符)UFEFF (零宽度不换行空格)def embed_zwc(text, watermark): zwc_map { 0: \u200b, 1: \u200c, : \u200d } # 将水印转为二进制并用空格分隔 binary .join(format(ord(c), 08b) for c in watermark) zwc_watermark .join(zwc_map.get(c, ) for c in binary) # 在原文第三个字符后插入 return text[:3] zwc_watermark text[3:] def extract_zwc(text): zwc_reverse { \u200b: 0, \u200c: 1, \u200d: } binary [] for char in text: if char in zwc_reverse: binary.append(zwc_reverse[char]) binary_str .join(binary) watermark for byte in binary_str.split( ): if byte: watermark chr(int(byte, 2)) return watermark # 使用示例 marked_text embed_zwc(重要合同内容, AUTHOR:张三) print(f含水印文本长度{len(marked_text)}) # 肉眼看起来与原文本相同 print(extract_zwc(marked_text)) # 输出: AUTHOR:张三零宽字符水印的独特优势在于跨平台兼容能在PDF、Word、网页等各种文本载体中存活抗格式修改即使改变字体/颜色/排版水印依然存在隐蔽性强常规检查根本无法发现注意某些社交平台会过滤零宽字符使用前需测试目标系统的兼容性。对于关键应用建议混合使用多种零宽字符提升鲁棒性。3. 数据库水印给数据打上隐形身份证数据库水印需要在不影响数据使用的前提下为每条记录植入溯源标记。以数值型数据为例我们采用改进的LSB算法——只对特定位置的记录进行修改避免全表变动。import hashlib import sqlite3 class DatabaseWatermarker: def __init__(self, db_path, secret_key): self.conn sqlite3.connect(db_path) self.key secret_key def _get_marked_positions(self, total_records, watermark): # 用密钥水印生成确定性的记录位置 hash_str hashlib.sha256((self.key watermark).encode()).hexdigest() positions set() for i in range(0, len(hash_str), 4): pos int(hash_str[i:i4], 16) % total_records positions.add(pos) return sorted(positions) def embed(self, table_name, column_name, watermark): cursor self.conn.cursor() cursor.execute(fSELECT rowid, {column_name} FROM {table_name}) records cursor.fetchall() marked_positions self._get_marked_positions(len(records), watermark) binary_mark .join(format(ord(c), 08b) for c in watermark) for i, pos in enumerate(marked_positions): if i len(binary_mark): break rowid, value records[pos] new_value int(value) | (int(binary_mark[i]) 1) # 使用次低位 cursor.execute( fUPDATE {table_name} SET {column_name}? WHERE rowid?, (new_value, rowid) ) self.conn.commit() def extract(self, table_name, column_name, watermark): cursor self.conn.cursor() cursor.execute(fSELECT rowid, {column_name} FROM {table_name}) records cursor.fetchall() marked_positions self._get_marked_positions(len(records), watermark) binary_str [] for i, pos in enumerate(marked_positions): if i len(watermark) * 8: break value records[pos][1] bit (value 1) 1 binary_str.append(str(bit)) watermark for i in range(0, len(binary_str), 8): byte binary_str[i:i8] if len(byte) 8: watermark chr(int(.join(byte), 2)) return watermark # 使用示例 watermarker DatabaseWatermarker(sales.db, COMPANY_SECRET) watermarker.embed(transactions, amount, DEP001) # 数据泄露后提取水印 leaked_db DatabaseWatermarker(leaked.db, COMPANY_SECRET) print(leaked_db.extract(transactions, amount, DEP001)) # 输出: DEP001数据库水印设计要点选择性修改只改动部分记录的关键位保持数据统计特性密钥绑定水印位置由密钥决定不知道密钥无法提取容错设计即使部分数据被修改仍能提取完整水印多重验证在不同字段植入相同水印提高检测成功率4. 水印技术实战保护Python源代码将上述技术组合使用我们可以为Python源代码文件创建多层保护import ast import zlib def protect_source(code, owner_id): # 第一层在注释中添加零宽字符水印 zwc_mark embed_zwc(, fOWNER:{owner_id}) protected f# Copyright {zwc_mark}\n{code} # 第二层在AST节点中添加隐形属性 tree ast.parse(code) for node in ast.walk(tree): if isinstance(node, (ast.FunctionDef, ast.ClassDef)): node.name \u200b # 在名称后添加零宽字符 # 第三层生成校验哈希 checksum zlib.adler32(code.encode()) 0xffffffff protected f\n__checksum__ {checksum}\n return ast.unparse(tree) # 验证函数 def verify_source(code, owner_id): # 提取零宽字符水印 first_line code.split(\n)[0] extracted extract_zwc(first_line) if fOWNER:{owner_id} not in extracted: return False # 验证校验和 checksum_line code.strip().split(\n)[-1] if not checksum_line.startswith(__checksum__ ): return False expected int(checksum_line.split()[1].strip()) actual zlib.adler32(code.split(__checksum__)[0].encode()) 0xffffffff return expected actual这种组合方案实现了可见版权声明常规注释隐形身份标记零宽字符代码完整性校验 Adler-32哈希结构特征标记AST节点修改实际项目中可以根据需要选择不同层级的保护。对于商业软件还可以将水印信息编译到字节码中实现更高级别的保护。

LMEB长程记忆基准：构建大模型持久记忆系统的评测与实践指南

1. 项目概述：为什么我们需要一个全新的长程记忆基准？如果你在过去一年里深度参与过大语言模型（LLM）或智能体（Agent）的开发与评测，大概率会和我有同样的感受：现有的基准测试&#xff…...

2026/6/1 4:04:36 阅读更多 →

别再手动拖拽了！用ArcGIS Pro二次开发，5分钟搞定全国分幅GDB数据自动合并

告别低效操作：ArcGIS Pro二次开发实现GDB数据智能合并实战指南清晨的第一杯咖啡还没喝完，办公桌上已经堆满了待处理的GDB文件。作为测绘行业的老兵，张工盯着屏幕上近百个分幅数据库文件叹了口气——这已经是本周第三次需要手动合并全国1:5万地…...

2026/6/1 4:04:30 阅读更多 →

Webpack深度解析：从核心原理到React项目实战配置指南

1. 从“Webpack是构建工具”到一篇完整博文：GPT-3的尝试与我们的深度拆解前几天在Hacker Noon上看到一篇挺有意思的文章，标题叫《OpenAI GPT-3 Wrote This Article About Webpack》。作者只给了GPT-3模型一句简单的提示——“webpack is a build tool”&…...

2026/6/1 4:00:59 阅读更多 →

Windows防撤回终极指南：如何永久保存微信QQ撤回消息

Windows防撤回终极指南：如何永久保存微信QQ撤回消息【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁（我已经看到了，撤回也没用了） 项目地址: https://gitcode.com/…...

2026/6/1 2:02:21 阅读更多 →

终极视频下载解决方案：VideoDownloadHelper 完全指南

终极视频下载解决方案：VideoDownloadHelper 完全指南【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为无法保存网络上的精彩…...

2026/5/31 0:01:42 阅读更多 →

小微企业合作网络与成长预测解析方案【附代码】

✨ 长期致力于小微企业、合作网络、网络结构、企业成长、成长预测研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于提名生成法的合作网络构建与结构…...

2026/5/31 0:03:05 阅读更多 →

终极键盘映射工具：如何免费解决游戏按键冲突问题

终极键盘映射工具：如何免费解决游戏按键冲突问题【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否曾在激烈的游戏中因为同时按下左右方向键而让角色卡顿不前？是否在关键时刻因为按键…...

2026/5/31 0:09:56 阅读更多 →