Bu yazımızda OCR Nedir, Optik karakter tanıma ya da kısaca OKT ile ilgili iş süreçlerinizi Robotik Süreç Otomasyonu ile nasıl otomatize edebilirsiniz? gibi konulara Kronnika gözünden yaklaşacağız.
OCR Nedir?
Wikipedia’ya göre OCR (Optical Character Recognition), bilgisayar ortamında bulunmayan yazılı dokümanların özel tarayıcılar veya normal olarak taranmış resimlerinin bazı özel programlar arayıcılığıyla bilgisayar ortamına düzenlenebilecek sayısal halde aktarılmasıdır. Okunmuş resim veya doküman metin dosyası olarak kaydedilir. Gündelik hayatımızda en bilinen uygulamalarından biri otomatik plaka tanımadır. Yoldan geçen araçların plakalarının fotoğrafı çekilir ve anında OCR uygulamasından geçirilerek sisteme girilir.
Her Optik Karakter Tanıma sistemi, geliştiriciye ve amaca bağlı olarak biraz farklı çalışsa da, tüm OCR yazılımı türlerine uygulanabilecek bazı yaygın dosya işleme adımları vardır:
Pre-processing (ön-işleme)
Karakterlerin tanınması sırasında kusurları ortadan kaldıran ön işleme adımındaki en yaygın yöntemler arasında de-skewing (eğriltme), line-removal (hat veya blok kaldırma), binarisation (blokların ayrıştırılması), segmentasyon, script recognition (komut tanıma) ve veri yakalamayı sayabiliriz.
Character recognition (karakter tanıma)
Bu adım, her karakterin ayrılmasını ve tüm piksel karakterlerinin ve boşluklarının tanınmasını ifade eder. Her karakterin işlenmesi, sistemin belirli karakter gruplarını sözcükler olarak tanımasını sağlar. Genellikle, tanıma iki tekniğe dayanır:
-
- Matris eşleştirme
- Özellik çıkarma
Post-processing (işlem-sonrası veya rötuş)
Veri işleme tamamlandıktan sonra yazılım, verilerin doğruluğunu artırır. Bu adımda, nihai verilerin ve çıktının doğruluğu 2 faktöre bağlı olacaktır: OCR sisteminin karmaşıklığı ve ilk verilerin karmaşıklığı. Örneğin, tipik olarak, basit OCR sistemleri standart yazı tiplerini kitaplıklarında saklar ve belgenin farklı yazı tipleri veya el yazısı metin içermesi durumunda, kütüphanesinde depolanan standart yazı tiplerine sahip basit OCR, ona uygun meta verileri atayamaz. Belgenin karmaşık ve standartlaştırılmamış karakterler içermesi durumunda, gelişmiş OCR sistemlerine ihtiyaç duyulur.
Robotik Süreç Otomasyonu ile OCR
Şimdi Optik Karakter Tanıma hakkında biraz bilgi sahibi olduğumuza göre, OCR’nin yaygın olarak kullanıldığı teknoloji olan Robotik Süreç Otomasyonuna biraz daha derinlemesine bakalım.
Robotik Süreç Otomasyonu veya RPA, insanların iş süreçlerini daha verimli bir şekilde yürütmek için bilgisayar yazılımları içinde bir çalışanın eylemlerini taklit eden “dijital iş gücünü” veya programlanmış robotları konuşlandırmasına olanak tanıyan bir teknolojidir. RPA, genellikle çok zaman alan, tekrarlayan, sıradan ve periyodik görevlerle ilişkilidir. Şirketlerin günlük operasyonel rutinlerinin otomasyonunda OCR ve RPA birlikte uyum içinde çalışabilen teknolojilerdir.
RPA ve OCR Birlikte Nasıl Çalışır?
OCR, basılı veya taranmış dosyalar, faturalar, sözleşmeler, üzerlerinde altyazılı metinler içeren dokümanlar gibi çeşitli belgelerdeki bilgileri tanımak ve okumak için kullanılırken, RPA, bilgilerin belirli program ya da sistemlere – CRM’lere doğru şekilde dağıtılmasına yardımcı olur.
Tipik olarak Optik Karakter Tanıma yüksek düzeyde yapılandırılmış belgelerde kullanılırken, RPA ile birlikte çeşitli biçimdeki yapılandırılmamış dosyaları işleyebilir ve analiz edebilir. Ayrıca, RPA yazılım robotları çeşitli senaryolara uyum sağlayabilir ve OCR’nin tek başına yapamayacağı veri toplama ve analiz süreçlerini iyileştirebilir. Peki bir doküman işleme süreci hangi adımları içerir?
- Tanımlama: Belgenin türü; okunabilir yazı formu, el yazısı formu, taranmış yazı formu vb. olarak tanımlanması
- Sınıflandırma: Tanımlanan formata göre fatura, sözleşme, imzalı çıktı gibi belgelerin sınıflandırılması
- Okuma: Karakter bazlı belge okunması
- Aksiyon/Özümleme: Anımsatıcıların ayarlanması, bildirimlerin gönderilmesi, verilerin yapılandırılmış biçimde saklanması gibi sonuca dayalı aksiyonların gerçekleştirilmesi
OCR Gerektiren Belge Tiplerine Örnekler
- Vergi formları
- Yasal Maliyet Faturaları
- Tıbbi Kodlama / Transkripsiyon Teşhis
- Reçeteler
- Prosedürler
- Talep İşleme
- Poliçeler
- Puanlama Tabloları
Süreçlerinizi Kronnika Robotlarına Devredin!