קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
סורק מסמכים
דיגיטציה של מסמכים פיזיים, שמאפשרת למשתמשים להמיר מסמכים פיזיים לפורמטים דיגיטליים, הפכה לתהליך נפוץ מאוד שמשתמשים באפליקציות לנייד.
Document Scanner API של ML Kit מספק פתרון מקיף עם זרימה עקבית ואיכותית של ממשק המשתמש באפליקציות ובמכשירים של Android. ברגע שתהליך הסריקה מופעל מהאפליקציה, למשתמשים יש שליטה מלאה על תהליך הסריקה. הם יכולים לחתוך את המסמכים הסרוקים, להחיל פילטרים, להסיר צלליות וכתמים ולשלוח בקלות את הקבצים הדיגיטליים ששמורים באפליקציה.
זרימת ממשק המשתמש, מודלים של למידת מכונה ומשאבים גדולים אחרים מועברים באמצעות Google Play Services, כלומר:
השפעה נמוכה על גודל בינארי (כל המודלים של למידת המכונה והמשאבים הגדולים) יורדים באופן מרוכז ב-Google Play Services).
לא נדרשת הרשאת גישה למצלמה – סורק המסמכים משתמש בהרשאת המצלמה של Google Play Services, והמשתמשים יכולים לקבוע אילו קבצים לשתף עם האפליקציה.
ממשק משתמש עקבי ואיכותי לדיגיטציה של מסמכים פיזיים.
צילום אוטומטי באמצעות זיהוי מסמכים.
זיהוי קצה מדויק לקבלת תוצאות חיתוך אופטימליות.
זיהוי סיבוב אוטומטי כדי להציג את המסמכים בצורה זקופה.
עריכת פונקציות של חיתוך, החלת פילטרים, הסרת צלליות, ניקוי כתמים ושליחת קבצים דיגיטליים בחזרה לאפליקציה בצורה חלקה.
מתבצע עיבוד במכשיר, תוך שמירה על פרטיות המשתמש.
לא נדרשת הרשאת גישה למצלמה באפליקציה.
השפעה נמוכה על הגודל הבינארי של ה-APK.
התאמה אישית
ה-Document Scanner API מספק זרימה מלאה ובאיכותית של ממשק המשתמש, באופן עקבי בכל האפליקציות ל-Android. עם זאת, אפשר גם להתאים אישית כמה היבטים של חוויית המשתמש:
מספר הדפים המקסימלי:
מגדירים הגבלה למספר הדפים שנסרקו.
ייבוא גלריה:
הפעלה או השבתה של היכולת לייבא מגלריית התמונות.
עריכת פונקציות:
התאמה אישית של פונקציות העריכה שזמינות למשתמש על ידי בחירה מבין 3 מצבים:
SCANNER_MODE_BASE: יכולות עריכה בסיסיות (חיתוך, סיבוב, שינוי סדר הדפים וכו').
SCANNER_MODE_BASE_WITH_FILTER: הוספת מסנני תמונות (גווני אפור, שיפור תמונות אוטומטי וכו') למצב SCANNER_MODE_BASE.
SCANNER_MODE_FULL (ברירת המחדל): הוספה של יכולות ניקוי תמונות התומכות ב-ML (מחיקת כתמים, אצבעות וכו') למצב SCANNER_MODE_BASE_WITH_FILTER. המצב הזה גם יאפשר הוספה אוטומטית של תכונות חשובות עתידיות, כולל עדכונים של שירותי Google Play. שני המצבים האחרים ימשיכו לשמור על קבוצות התכונות הנוכחיות שלהם ולקבל רק שיפורים קלים.
מצב בסיס
מצב בסיס עם מסנן
מצב מלא
תוצאות לדוגמה
התמונה המקורית
מסמך סרוק עם תיקון פרספקטיבה, הסרת קמטים וההחלת פילטר של גווני אפור
התמונה המקורית
המסמך שנסרק סובב באופן אוטומטי לאחר הסרת הכתם והוחל מסנן צבעים
התמונה המקורית
מסמך סרוק ללא כתמים והוחל מסנן אוטומטי
התמונה המקורית
המסמך שנסרק סובב באופן אוטומטי ללא צללית והוחל המסנן האוטומטי
התמונה המקורית
המסמך שנסרק סובב באופן אוטומטי ללא האצבע והוחל המסנן האוטומטי
[null,null,["עדכון אחרון: 2025-07-25 (שעון UTC)."],[[["\u003cp\u003eML Kit's Document Scanner API enables digitization of physical documents within Android apps, providing a high-quality and consistent user interface.\u003c/p\u003e\n"],["\u003cp\u003eThe API offers on-device processing, ensuring user privacy and eliminating the need for camera permissions from the app.\u003c/p\u003e\n"],["\u003cp\u003eUsers have control over the scanning process, including cropping, applying filters, removing imperfections, and sharing the digitized files.\u003c/p\u003e\n"],["\u003cp\u003eCustomization options are available to tailor the user experience, such as limiting pages, enabling gallery imports, and adjusting editing functionalities.\u003c/p\u003e\n"],["\u003cp\u003eThe API leverages Google Play services for model delivery, minimizing app size and enabling automatic updates for enhanced features.\u003c/p\u003e\n"]]],["The document scanner API allows users to digitize physical documents within Android apps. Key actions include automatic document capture, edge and rotation detection, and editing features like cropping, filtering, and stain/shadow removal. The API operates on-device and uses Google Play services, ensuring low binary size impact and eliminating the need for camera permissions. Customization options are provided for the maximum number of pages, gallery import, and three editing modes, with the full mode offering the most feature set.\n"],null,["Document scanner\n----------------\n\n| This API is offered in beta, and is not subject to any SLA or deprecation policy. Changes may be made to this API that break backward compatibility.\n\nDigitizing physical documents, which allows users to convert physical documents\ninto digital formats has become a very common user journey in mobile apps.\nML Kit's document scanner API provides a comprehensive solution with a\nhigh-quality, consistent UI flow across Android apps and devices. Once the\ndocument scanner flow is triggered from your app, users retain full control over\nthe scanning process. They can optionally crop the scanned documents, apply\nfilters, remove shadows or stains, and easily send the digitized files back to\nyour app.\n\nThe UI flow, ML models and other large resources are delivered using Google Play\nservices, which means:\n\n- Low binary size impact (all ML models and large resources are downloaded centrally in Google Play services).\n- No camera permission is required - the document scanner leverages the Google Play services' camera permission, and users are in control of which files to share back with your app.\n\nThe entire document scanner flow operates on-device.\n\n[Android](/ml-kit/vision/doc-scanner/android)\n\n### Key capabilities\n\n- High-quality and consistent user interface for digitizing physical documents.\n- Automatic capture with document detection.\n- Accurate edge detection for optimal crop results.\n- Automatic rotation detection to show documents upright.\n- Editing functionalities to crop, apply filters, remove shadows, clean stains, and seamlessly send digitized files back to your app.\n- On-device processing, preserving user's privacy.\n- No camera permission is needed from your app.\n- Low apk binary size impact.\n\n### Customization\n\nThe document scanner API provides a high-quality fully fledged UI flow that is\nconsistent across Android apps. However, there is also room to customize some\naspects of the user experience:\n\n- **Maximum number of pages:** \n\n Set a limit to the number of pages scanned.\n\n- **Gallery import:** \n\n Enable or disable the capability to import from the photo gallery.\n\n- **Editing functionalities:** \n\n Customize the editing functionalities available to the user by choosing\n from 3 modes:\n\n - `SCANNER_MODE_BASE`: basic editing capabilities (crop, rotate, reorder pages, etc...).\n - `SCANNER_MODE_BASE_WITH_FILTER`: adds image filters (grayscale, auto image enhancement, etc...) to the `SCANNER_MODE_BASE` mode.\n - `SCANNER_MODE_FULL` (default): adds ML-enabled image cleaning capabilities (erase stains, fingers, etc...) to the `SCANNER_MODE_BASE_WITH_FILTER` mode. This mode will also allow future major features to be automatically added along with Google Play services updates, while the other two modes will maintain their current feature sets and only receive minor refinements.\n\n| Base mode | Base mode with filter | Full mode |\n|-----------|-----------------------|-----------|\n| | | |\n\n### Example results\n\n| Original picture | Scanned document with perspective corrected, wrinkle removed and grayscale filter applied |\n|------------------|-------------------------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with stain removed and color filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document with stain removed and auto filter applied |\n|------------------|-------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with shadow removed and auto filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with finger removed and auto filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |"]]