Veri uzmanlarının zamanlarının büyük bir çoğunluğunu veri setlerinin bakımı ve yönetimi alıyor olması dikkat çekici bir bilgidir. Araştırmaya katılan 456 kişilik katılımcı grubunun yaklaşık yüzde 55’inin zamanlarının bu faaliyetlere ayırıyor olması, veri yönetimindeki zorlukları gözler önüne sermektedir. Veri setlerinin güncelliğinin sağlanması, düzenli arşivlenmesi, farklı kaynaklardan toplanan verilerin bir araya getirilmesi gibi rutin süreçlerin zaman alıcı olması anlaşılabilir. Ancak bu oranın oldukça yüksek çıkması, şirketlerin veri yönetim stratejilerinde ve süreçlerinde iyileştirmeye ihtiyaç duyduklarını göstermektedir. Veri bilimcilerinin ve uzmanlarının daha değerli işlere, yeni projelere ve analizlere odaklanabilmeleri için veri temelli iş süreçlerinin otomasyonu ve iyileştirilmesi gerekmektedir. Veri bakımı ve yönetiminin zaman açısından ne kadar meşgul edici olduğunun farkına varan şirketlerin artık daha etkin yönetim çözümlerine yönelecekleri düşünülmektedir.
Farklı kaynaklardan toplanan verilerin birleştirilmesi süreci araştırmaya katılan veri uzmanlarının en büyük zorluklarından biri olarak öne çıkmaktadır. Günümüzde şirketler birden fazla veri tabanı, uygulama ve sistemden veri elde etmek zorunda kalmaktadır. Farklı formatlarda saklanan ve farklı tanımlama stratejileri kullanılan bu verilerin bir araya getirilmesi zaman alıcı karmaşık bir süreçtir. Bu süreç hem insan kaynakları hem de teknoloji altyapısı gerektirdiğinden maliyetlidir. İnternet ölçekli iş modelleri ve yoğun rekabet gibi koşulların getirdiği zorunluluklar, şirketlerin daha hızlı karar almasını gerektirmektedir. Ancak veri entegrasyonundaki zorluklar, analizlerin ve iş zekası süreçlerinin gecikmesine neden olmaktadır. Veri birleştirme sorunlarının çözümüyle şirketler veri odaklı iş stratejilerini ve müşteri deneyimlerini daha etkin şekilde optimize edebileceklerdir.
Araştırmaya katılan şirketlerin önemli bir kısmının veri kalitesine, platformlarına ve kataloglarına yatırımlarını sürdürmeyi planladığı önemli bir bulguya işaret etmektedir. Verinin doğru ve güvenilir olması, şirketlerin rekabet üstünlüğü açısından hayati öneme sahiptir. Kirliliği olan ya da eksik veriler analizleri ve sonuçları olumsuz etkileyebileceği gibi, yanlış kararlara da yol açabilir. Veri kalitesini yükseltmek için yapılacak yatırımlar sayesinde şirketler daha isabetli planlamalar yapabilecek, müşteri deneyimini iyileştirebilecek ve süreçleri optimize edebileceklerdir. Veri merkezlerine, iş zekası araçlarına ve veri kataloglamasına ayırılan kaynakların artması, şirketlerin veri stratejilerine verdikleri önemin bir göstergesi olup sektördeki dijital dönüşüm yolculuklarının da ilerlemesine katkı sağlayacaktır.
Veri sahipliğindeki belirsizliklerin, şirketlerde önemli zaman kayıplarına yol açtığı ifade edilmektedir. Verinin kim tarafından üretildiği, kimin/kimlerin sorumlu olduğunun net olmaması bilgi kirliliğine ve verimsiz süreçlere yol açabilmektedir. Örneğin, farklı departmanlardan gelen verilerin sahipliği belirsizse, bu verilerin analiz ve raporlaması sırasında sorunlar yaşanabilir. Veri sahipliğinin netleştirilmesi ise kolay bir süreç değildir. Organizasyon yapısı ve süreçlerinin karmaşıklığı bu belirsizlikleri artırabilmektedir. Ancak net veri sahiplik yapısı, veri paylaşımını ve yeniden kullanımını kolaylaştırarak, veri analitiği ve iş zekası faaliyetlerinin daha verimli şekilde yürütülmesini sağlayacaktır. Diğer taraftan veri odaklı projelerde de sinerji yakalanması mümkün olacaktır.
Şirketlerin veri toplama, yönetimi ve yeniden kullanım kültürüne bakışının geleneksel uygulamalardan ziyade yenilikçi yaklaşımlar gerektiğine dair ifadeler dikkat çekicidir. Uzun yıllar veri, şirket uygulamaları vasıtasıyla toplanmış ve bu uygulamaların mantığı çerçevesinde saklanmıştır. Oysa günümüzde çok kanaldan ve farklı kaynaklardan gelen büyük veri vasıflarına sahip verinin, merkezi bir yerde toplanması ve dijital dönüşüm için yeniden kullanılabilir olması önem kazanmıştır. Bu noktada verinin değer zincirinde katma değer üretebileceği farklı noktalarda üretilmesi, toplanması, analiz edilerek farklı sistemlerle paylaşılması gerekmektedir. Bunun için şirketlerin veri kültürünü ve altyapılarını yenilikçi bir bakış açısıyla yeniden tasarlaması gerekecektir. Yaratıcı çözümlere ve verinin faydaya dönüştürülmesine odaklanan bir anlayışın benimsenmesi şarttır.
Şirketlerin miras veri mimarilerinden kaynaklanan entegrasyon maliyetlerinin artış eğiliminde olduğuna dair ifadeler, söz konusu mimarilerin ölçeklendirilememesi ve eskimesi sorunlarına işaret etmektedir. Geleneksel yazılım geliştirme yaklaşımlarıyla oluşturulan sistemlerin, günümüzün çok katmanlı ve karmaşık mimari gereksinimlerini karşılamada yetersiz kaldığı anlaşılmaktadır. Farklı sistemler arasında veri akışını ve bütünleşmeyi sağlamak için ayırılan kaynaklar her geçen yıl artış göstermekte, entegrasyon maliyetleri işletmeleri oldukça yormaya başlamaktadır. Verinin standartlara dayalı semantik graf yapısı ile modele edilmesi ve bir veri katmanı altında toplanması, sistemler arası entegrasyonu kolaylaştırarak bu maliyetlerin azalmasını sağlayacaktır. Böylece kaynaklar daha verimli şekilde analiz, görselleştirme ve iş zekası faaliyetlerine yönlendirilebilecektir.
Entegrasyon maliyetlerinin artış eğiliminin, işletmeler tarafından yeterince fark edilmediği ifade edilmektedir. Oysa mimari karmaşıklıkların yol açtığı bu maliyetlerin önemi giderek artmaktadır. Klasik yaklaşımlarla tasarlanan eski sistemler nedeniyle, her yıl veri entegrasyonu için ayırılan bütçeden önemli bir pay harcanmakta ancak söz konusu maliyetler genellikle fark edilmemektedir. Halbuki işletmelerin IT bütçelerinin önemli bir oranının veri entegrasyonu bedellerine gittiği gerçeği göz önüne alındığında, bu sorunun farkına varılması gerekmektedir. Veri odaklı modele geçiş ile standartlara uygun yapılandırılmış verilerin tek bir katman altında toplanması sayesinde, entegrasyon maliyetlerinin artış eğilimi kontrol altına alınabilece ve kaynaklar daha verimli kullanılabilecektir. İşletmelerin entegrasyon maliyetlerinin iyileştirilmesi için çözüm aradıklarına şahit olmaktayız.
Entegrasyon maliyetlerinin artış eğiliminin işletmeler tarafından yeterince fark edilmemesinin sebeplerinden biri, bu maliyetlerin lentiyle değerlendirilmemesidir. Oysa entegrasyon maliyetleri, genellikle yıllık IT bütçelerinin önemli bir kısmını oluşturmaktadır. Ancak bu maliyet unsuru ayrı bir kalem olarak izlenmediği için, ciddi bir gider unsuru olarak görülememektedir. İşletmeler, IT harcamalarını geleneksel olarak donanım, yazılım, insan kaynakları gibi kalemlere ayırmakta ve entegrasyon giderlerini bu kategorilerin içinde eritmektedir. Oysa entegrasyon maliyetlerine yoğunlaşarak, standart ara yüzler, veri modellemesi gibi çözümlerle bu giderleri optimize etme fırsatı kaçırılmaktadır. İşletmelerin, entegrasyon giderlerini ayrı bir kalem olarak tanımlayarak bunları izlemesi ve iyileştirme çalışmalarına ağırlık vermesi gerekmektedir.
Veri kalitesine odaklanmanın ve kaynağa yakınlığın önemi konusunda ifade edilen görüşlere katılmakla beraber, bunun pratikte nasıl gerçekleştirilebileceği de önem taşımaktadır. Verinin oluştuğu ilk noktada kalite kontrolünün ve doğruluğunun sağlanması için, veri üreticisiyle iletişim kurulması ve veri formatlarının standardize edilmesi gerekir. Ancak bunun maliyeti ve zorluğu düşünüldüğünde her kaynak için aynı yaklaşım uygulanması mümkün görünmemektedir. Risk analizleriyle kritik veri kaynakları belirlenmeli, bu noktalarda kullanıcı deneyimini kolaylaştıracak ve hata payını düşürecek ara yüzler / formüler geliştirilmelidir. Ayrıca, farklı sistemlerden gelen verilerin semantik olarak eşlenebilmesi için ontoloji tabanlı modelleme de kullanılabilir. Böylece hem kaynak yakınlığı sağlanır hem de veriler geniş ölçekte kullanıma sunulur.
Verinin değerli hale getirilebilmesi ve faydaya dönüştürülebilmesi için, üreticisinin bakış açısının anlaşılmasının ve paylaşılabilir veri kaynaklarının olmasının önemine değinen ifadeler doğruyum görüşmektedir. Verinin anlamlandırılması ve yorumlanmasında, o veriyi nasıl ve ne amaçla ürettiğini bilmek çok önemlidir. Bunun için veri üretim süreçlerine dahil olmak ve üreticilerle iletişim halinde olmak gerekir. Ayrıca, farklı birimlerce ortaklaşa kullanılabilecek şekilde organize edilmiş veri havuzlarının oluşturulması, verinin maksimum faydaya dönüştürülmesini sağlayacaktır. Teknolojik altyapının getirdiği kolaylıklarla, verinin sahibinden bağımsız olarak farklı uygulamalarda kullanılabilmesi mümkün hale gelmelidir. Böylece veri bilimciler analiz ve modelleme çalışmalarında daha verimli olacaklardır.