google/magika
google/magika
谷歌推出的 AI 工具,能精准识别文件真实类型,防止伪装文件,速度快且准确率高。
Fast and accurate AI powered file content types detection
Stars
15,721
Forks
874
Watchers
57
Issues
134
AI 分析简介
🔍
这个项目是做什么的
简单说,它就是文件的“火眼金睛”。不管文件后缀名是什么,它都能通过 AI 分析文件内容,告诉你这到底是个 PDF、图片还是可执行程序。
🔧
它能帮你解决什么问题
解决文件伪装带来的安全隐患。比如黑客把病毒打包成 .txt,传统方法可能被骗,它能看穿伪装。替代了那些只看后缀名的老旧检测方式。
👥
适合哪些人
适合安全研究员、系统管理员,或者需要处理大量文件下载的开发者。普通用户如果担心下载文件安全,也可以试试。
📋
典型使用场景
1. 自动扫描下载文件夹,识别潜在恶意文件。
2. 在邮件或网盘系统中,快速分类和过滤内容。
3. 开发文件上传功能时,防止用户上传危险格式。
4. 整理混乱的电脑文件,按真实类型归类。
⭐
核心优势与亮点
速度快(5 毫秒一个文件)、准确率高(99%)、模型小不占内存。谷歌亲测用于 Gmail 和病毒扫描,可信度拉满。
🚀
上手门槛
需要安装 Python 环境或命令行工具,不需要 API Key,本地直接运行,有网页版演示可以先体验。
🎯
用途
适合需要精准识别文件内容的安全扫描或文件整理场景。如果是简单看后缀名或不需要内容分析,没必要用这个。
分类
安全与隐私AI 相关
技术栈
—
标签
file-typeai-detectionSecurityPythonrustgoogleonnx
项目信息
- 主语言
- Python
- 默认分支
- main
- 协议
- Apache-2.0
- 创建时间
- 2023年8月22日
- 最近提交
- 2 天前
- 最近推送
- 2 天前
- 收录时间
- 2026年4月18日