Neler yeni

KFN Windows 11 Google Lens’e rakip oldu!

📢 KralForum’a Hoş Geldiniz!

Sadece üyelere özel içeriklere erişmek ve topluluğumuzun bir parçası olmak için şimdi ücretsiz üye ol. 👉 Hemen aramıza katıl, sohbetlere dahil ol ve ayrıcalıkları keşfet!

KFN Haberleri: Windows 11 Google Lens’e Rakip Oldu! Microsoft'un Yeni Görsel Zeka Stratejisi​

Dijital dünyayla etkileşim biçimimiz, metin tabanlı komutlardan giderek daha fazla görsel girdilere kayıyor. Yıllardır bu alanda "Google Lens" tartışmasız lider konumdaydı; bir fotoğraf karesiyle dünyayı sorgulamamızı sağlayan bu sihirli araç, mobil cihazların vazgeçilmezi oldu. Ancak Microsoft, yapay zeka devrimindeki yeni hamleleriyle bu hakimiyete masaüstünden meydan okuyor. Windows 11'e entegre edilen yeni nesil araçlar, Google Lens'in sunduğu yetenekleri doğrudan işletim sistemi düzeyine taşıyarak, "görsel zeka" savaşında yeni bir cephe açıyor.

KFNHaberleri.png


Teknoloji devlerinin mücadelesi artık sadece en hızlı işlemciye veya en çok uygulamaya sahip olmakla sınırlı değil. Savaşın yeni adı: Yapay zeka entegrasyonu. Google, yapay zekayı arama motoru ve mobil işletim sistemi Android üzerinden domine ederken, Microsoft bu devrimi doğrudan dünyanın en yaygın masaüstü işletim sistemi olan Windows'un kalbine yerleştirmeyi seçti.

Bu stratejinin en somut örneklerinden biri, Google Lens'in işlevlerini parça parça devralan ve hatta bazı yönlerden aşan Windows 11 özellikleri oldu. Peki, Microsoft'un bu meydan okuması ne kadar güçlü? Gerçekten de bir "Lens" katiliyle mi karşı karşıyayız, yoksa bu sadece gecikmiş bir "yakalama" çabası mı? Bu detaylı analizde, Microsoft'un görsel zeka araçlarını, kullanım senaryolarını ve Google Lens karşısındaki stratejik konumlarını inceliyoruz.

Bölüm 1: Tahtın Sahibi - Google Lens'in Yükselişi ve Hakimiyeti​

Microsoft'un hamlesini anlamak için öncelikle rakibinin ne kadar güçlü olduğunu kabul etmek gerekiyor. Google Lens, 2017'de piyasaya sürüldüğünde, bir akıllı telefon kamerasını bir "görsel arama motoruna" dönüştürme vaadiyle geldi. Başlangıçta basit nesne tanıma ile sınırlı olan Lens, yıllar içinde Google'ın devasa bilgi grafiği (Knowledge Graph) ve makine öğrenimi altyapısı sayesinde korkutucu derecede yetenekli bir araca dönüştü.

Google Lens'in temel yetenekleri şunlardır:
  1. Metin Tanıma (OCR) ve Çeviri: Bir menü, sokak tabelası veya belge üzerindeki metni anında tanır, kopyalanabilir hale getirir ve 100'den fazla dile anında çevirebilir.
  2. Nesne ve Ürün Tanıma: Bir ayakkabı, mobilya veya elektronik cihazı kameraya gösterdiğinizde, o ürünün ne olduğunu tanır ve size alışveriş bağlantıları sunar.
  3. Yer ve Mekan Tanıma: Bir binanın veya anıtın fotoğrafını çektiğinizde, o yerin tarihi, adı ve çalışma saatleri gibi bilgileri getirir.
  4. Bitki ve Hayvan Tanıma: Bir çiçeğin veya böceğin türünü saniyeler içinde belirleyebilir.
  5. Ev Ödevi Yardımı: Matematik problemlerini veya karmaşık bilimsel diyagramları çözmek için adım adım rehberler sunar.
Google'ın stratejisi "her yerde olma" üzerine kuruluydu. Lens; Android kamera uygulamalarının içine, Google Fotoğraflar'a, Chrome tarayıcısına ve Google'ın ana arama uygulamasına derinlemesine entegre edildi. Bu, kullanıcıların Lens'i ayrı bir uygulama olarak düşünmeyi bırakıp, "Google ile görsel arama"nın doğal bir parçası olarak görmesini sağladı. Ancak bu gücün bir zayıf noktası vardı: Masaüstü deneyimi. Her ne kadar Chrome üzerinden erişilebilir olsa da, Lens her zaman "mobil öncelikli" bir araç olarak kaldı.

Bölüm 2: Microsoft’un İlk Darbesi: Ekran Alıntısı Aracı'nın Evrimi​

Microsoft'un Google Lens'e ilk ve en doğrudan cevabı, Windows'un en sevilen "küçük" araçlarından birini, yani Ekran Alıntısı Aracı'nı (Snipping Tool) yeniden icat ederek geldi. Yıllarca sadece ekran görüntüsü almaya yarayan bu basit araç, Windows 11'in son güncellemeleriyle güçlü bir OCR (Optik Karakter Tanıma) merkezine dönüştü.

Bu yeni özellik, "Metin Eylemleri" (Text Actions) olarak adlandırıldı ve kullanımı son derece basitti:
  1. Kullanıcı, ekranın herhangi bir yerinden (bir YouTube videosu, korumalı bir web sayfası, bir sunum slaytı veya taranmış bir PDF) bir ekran alıntısı alır.
  2. Açılan önizleme penceresinde, "Metin Eylemleri" adında yeni bir düğme belirir.
  3. Bu düğmeye tıklandığında, araç görüntüdeki tüm metni analiz eder ve seçilebilir/kopyalanabilir hale getirir.
Google Lens'in metin kopyalama işlevini masaüstüne taşıyan bu hamle, özellikle ofis çalışanları ve öğrenciler için devrim niteliğindeydi. Artık bir web seminerindeki konuşmacının slaydındaki metni not almak için tekrar yazmaya veya bir görseldeki hata kodunu kopyalamak için çaba sarf etmeye gerek kalmadı.

Ancak Microsoft burada durmadı. "Metin Eylemleri"ne ek olarak, "Hızlı Gizleme" (Quick Redact) adlı bir özellik daha ekledi. Bu araç, ekran alıntısındaki e-posta adresleri veya telefon numaraları gibi hassas bilgileri otomatik olarak algılayıp, tek bir tıklamayla bu bilgilerin üzerini karartmayı sağlar. Bu, Google Lens'in sunmadığı, doğrudan kurumsal kullanıma ve gizliliğe yönelik bir adımdı.

Bu noktada, Ekran Alıntısı Aracı, Lens'in sadece "metin" ayağına rakip olmuştu. Nesne tanıma veya görsel arama yapamıyordu. Ama bu, Microsoft'un çok daha büyük bir silahı devreye sokmasından hemen önceki adımdı.

Bölüm 3: Asıl Rakip: Windows Copilot ve Multimodal Yapay Zeka​

Eğer Ekran Alıntısı Aracı bir "tüfek" ise, Windows Copilot bir "filo" gücündedir. Microsoft'un işletim sisteminin sağına demirleyen bu yapay zeka asistanı, şirketin Google Lens'e ve hatta Google Arama'nın kendisine verdiği en güçlü yanıttır.

Copilot'un gücü, onun "multimodal" (çoklu modalite) yeteneklerinden gelir. Yani, sadece metinle değil, aynı zamanda görsellerle de çalışabilir. Copilot, Google Lens'in yaptığı her şeyi ve daha fazlasını yapabilme potansiyeline sahiptir.

Copilot'un Görsel Zeka Yetenekleri:
  • Sürükle ve Bırak ile Görsel Sorgulama: Kullanıcılar, masaüstlerinden veya web'den herhangi bir görseli doğrudan Copilot paneline sürükleyip bırakabilir.
  • "Bu Görüntüyü Açıkla": Temel işlev budur. Copilot, görüntüdeki nesneleri, manzarayı, kişileri ve eylemleri detaylı bir şekilde metne dökebilir.
  • Görsel Arama (Lens Gibi):
    • Ürün Bulma: Bir e-ticaret sitesindeki ayakkabının ekran görüntüsünü Copilot'a atıp, "Buna benzer, ancak daha ucuz olan modelleri bul" diyebilirsiniz. Lens size benzer ürünleri gösterir; Copilot ise bu ürünleri bulur, karşılaştırır ve size bir özet sunar.
    • Yer Tanıma: Tatil fotoğraflarınızdan birini atıp, "Burası neresi ve burada ne yapabilirim?" diye sorabilirsiniz. Copilot, mekanın adını (örn: Efes Antik Kenti) vermekle kalmaz, aynı zamanda oraya nasıl gidileceği veya en iyi ziyaret saatleri hakkında bilgi de verir.
  • Görüntü Üzerinden Akıl Yürütme (Lens'in Ötesinde):
    • Grafik Analizi: Bir finansal grafiğin ekran alıntısını verip, "Bu grafikteki ana eğilimleri özetle" diyebilirsiniz.
    • Hata Ayıklama: Bir yazılımcı, aldığı hata kodunun ekran görüntüsünü atıp, "Bu Python hatasını nasıl düzeltebilirim?" diye sorabilir.
  • OCR ve Çeviri: Ekran Alıntısı Aracı'nın yaptığı OCR işlevini de yerine getirir. Bir görüntüyü atıp, "Bu görseldeki metni çıkar ve İtalyanca'ya çevir" komutu verilebilir.
Stratejik Fark: Sorgu vs. Sohbet

Google Lens ile Microsoft Copilot arasındaki temel fark, etkileşim modelidir. Google Lens bir "sorgu" aracıdır; bir resim verirsiniz, o size bir cevap (genellikle bir arama sonucu sayfası) verir.

Copilot ise bir "sohbet" aracıdır. Bir resim verirsiniz ve o cevabı tartışabilirsiniz.
  • Lens: [Restoran menüsü fotoğrafı] -> [Metni çevirir] -> Biter.
  • Copilot: [Restoran menüsü fotoğrafı] -> "Bu menüdeki glütensiz seçenekler nelerdir?" -> Copilot: "Şu üç seçenek glütensiz görünüyor." -> Kullanıcı: "Peki, 'Pollo alla Cacciatora' hakkında bana biraz daha bilgi ver, içinde ne var?"
Bu "sohbet" yeteneği, Copilot'u pasif bir tanıma aracından aktif bir yardımcıya dönüştürür.

Bölüm 4: Ekosistemi Tamamlamak: Fotoğraflar ve Edge Tarayıcı​

Microsoft'un saldırısı sadece iki araçla sınırlı değil. Bu görsel zeka yetenekleri, ekosistemin diğer kilit parçalarına da hızla yayıldı.
  1. Windows Fotoğraflar Uygulaması:Tıpkı Google Fotoğraflar'ın yaptığı gibi, Windows'un yerel Fotoğraflar uygulaması da artık kendi içindeki tüm görselleri tarayarak OCR uyguluyor. Bu, kullanıcıların kişisel fotoğraf arşivlerinde metin araması yapabilmesi anlamına geliyor. Örneğin, Fotoğraflar uygulamasının arama çubuğuna "davetiye" yazdığınızda, içinde "davetiye" kelimesi geçen tüm parti, düğün veya etkinlik görsellerinizi bulabilir. Veya bir ilacın fotoğrafını çektiyseniz, o ilacın adını aratarak fotoğrafı bulabilirsiniz. Bu, Google Fotoğraflar kullanıcılarının yıllardır sevdiği bir özellikti ve şimdi doğrudan Windows'un yerel uygulamasında mevcut.
  2. Microsoft Edge:Google'ın Lens'i Chrome'a entegre etmesine karşılık, Microsoft da Edge tarayıcısına kendi görsel arama (Bing Visual Search) yeteneklerini ekledi. Bir web sayfasındaki herhangi bir görsele sağ tıkladığınızda, o görselle ilgili arama yapabilir veya "görselden metin kopyala" seçeneğini kullanabilirsiniz.

Sonuç ve Stratejik Analiz: Savaş Masaüstüne Taşındı​

Microsoft'un stratejisi açık: Google'ı kendi en güçlü olduğu kalede, yani masaüstü işletim sisteminde vurmak.

Google Lens, mobil cihazlarda rakipsiz olmaya devam edebilir, ancak Microsoft, Windows 11 ile "iş" ve "üretkenlik" dünyasında görsel zekanın standartlarını belirlemeye çalışıyor.
  • Ekran Alıntısı Aracı, hızlı, anlık metin çıkarma (utility) ihtiyacını karşılıyor.
  • Fotoğraflar uygulaması, kişisel arşiv (Google Photos) rekabetini karşılıyor.
  • Copilot ise, gelişmiş görsel sorgulama, analiz ve "her şeyin rakibi" olarak konumlanıyor.
Windows 11, artık sadece pencereleri yöneten bir sistem değil, aynı zamanda gördüklerinizi anlayan, analiz eden ve üzerine sohbet edebileceğiniz bir yapay zeka katmanına dönüştü.

Google Lens hala harika bir araç mı? Kesinlikle. Ancak, özellikle masaüstünde çalışan bir profesyonel veya öğrenciyseniz, ihtiyacınız olan görsel zeka araçları için artık başka bir yere bakmanıza gerek kalmayabilir. Microsoft, Google Lens'in sunduğu hemen hemen her özelliği Windows 11'in içine yerleştirdi ve üzerine bir de Copilot'un gelişmiş sohbet yeteneklerini ekledi. Görsel zeka savaşı resmi olarak masaüstüne taşındı ve Microsoft, ev sahibi avantajını sonuna kadar kullanıyor.

Peki Siz Bu Konuda Ne Düşünüyorsunuz?
 
Bu Konuyu Okuyanlar (Toplam Okuyanlar 0)
No registered users viewing this thread.

KFN Haberleri

Üst