排行榜/google/magika

google/magika

google/magika

谷歌推出的 AI 工具,能精准识别文件真实类型,防止伪装文件,速度快且准确率高。

Fast and accurate AI powered file content types detection

Stars
15,721
Forks
874
Watchers
57
Issues
134
💡

谷歌推出的 AI 工具,能精准识别文件真实类型,防止伪装文件,速度快且准确率高。

📂 安全与隐私🤖 AI 相关💻 Python📄 Apache-2.0

AI 分析简介

🔍

这个项目是做什么的

简单说,它就是文件的“火眼金睛”。不管文件后缀名是什么,它都能通过 AI 分析文件内容,告诉你这到底是个 PDF、图片还是可执行程序。

🔧

它能帮你解决什么问题

解决文件伪装带来的安全隐患。比如黑客把病毒打包成 .txt,传统方法可能被骗,它能看穿伪装。替代了那些只看后缀名的老旧检测方式。

👥

适合哪些人

适合安全研究员、系统管理员,或者需要处理大量文件下载的开发者。普通用户如果担心下载文件安全,也可以试试。

📋

典型使用场景

1. 自动扫描下载文件夹,识别潜在恶意文件。

2. 在邮件或网盘系统中,快速分类和过滤内容。

3. 开发文件上传功能时,防止用户上传危险格式。

4. 整理混乱的电脑文件,按真实类型归类。

核心优势与亮点

速度快(5 毫秒一个文件)、准确率高(99%)、模型小不占内存。谷歌亲测用于 Gmail 和病毒扫描,可信度拉满。

🚀

上手门槛

需要安装 Python 环境或命令行工具,不需要 API Key,本地直接运行,有网页版演示可以先体验。

🎯

用途

适合需要精准识别文件内容的安全扫描或文件整理场景。如果是简单看后缀名或不需要内容分析,没必要用这个。

分类

安全与隐私AI 相关

技术栈

标签

file-typeai-detectionSecurityPythonrustgoogleonnx

项目信息

主语言
Python
默认分支
main
协议
Apache-2.0
创建时间
2023年8月22日
最近提交
2 天前
最近推送
2 天前
收录时间
2026年4月18日