in

Big Data Nedir? Big Data (Büyük Veri) Madenciliği ve Kullanım Alanları!

big-data-nedir-big-data-madenciligi
big-data-nedir-big-data-madenciligi

Big Data Nedir? Big Data (Büyük Veri) Madenciliği ve Kullanım Alanları!

Bu içeriğimizde Big Data nedir? Sorusunu cevaplarken Büyük Veri Madenciliği konusuna da değinerek içeriğimizi renklendiriyoruz. Bilinen ismi ‘big data’ veya ‘dev veri’dir. Bloglar, ağ geçmişleri, fotoğraflar, videolar ve sosyal medya gibi değişik kaynaklardan toparlanan tüm verinin, anlamlı ve işlenebilir biçime dönüştürülmüş biçimine big data (büyük veri/dev veri) denir. Dev veri ilk olarak genetik alanında ortaya çıkmış olsa da geçmişte astronomide de kullanılmıştır.

Şimdi teknoloji çağında olmamızın sebebiyle internet ortamında da oldukça sık kullanılıyor ve kullanım alanı zaman geçtikçe genişliyor. Büyük veriye insanlar farkında olmadan katkıda bulunurlar. Büyük veri’nin içerisinde gereksiz olarak görünen birçok paylaşım da mevcuttur. Bu paylaşımlar da büyük verinin zaman/süreç içerisindeki genişleme yelpazesi gibi büyümekte ve önüne geçilememektedir. Geçmişte yapılan araştırmalara göre dünyada 1 gün içerisinde 3.4 kentrilyon byte veri üretilmektedir. 10 yıl içinde ise bu toplam veri büyüklüğünün 32 katına ulaşacağı tahmin ediliyor. Bu verileri yakından incelediğimiz zaman yapısal ve işlenebilir verilerin olmadığını ayrıca bir veri çöplüğünün oluştuğunu farkediyoruz. Bahsettiğimiz verilerin büyüklüğü petabyte, exabyte ve hatta zettabyte seviyesinde bile olabilir. bazı kurumlar ve şirketler günlük olarak 10 TB veriyi üretebiliyorken aynı zamanda bu veriyi saklayabilmektedirler. Bu konunun ekonomik boyutu ise oldukça maliyetli bir iştir. Big data (büyük veri) içerisinde belirli veri bileşenleri vardır. Bu veri bileşenleri 5V olarak tanımlanır.

Bu bileşenler ise;

  • Variety (Çeşitlilik)
  • Velecity (Hız)
  • Volume (Hacim – Veri büyüklüğü)
  • Verification (Doğrulama)
  • Value (Değer) isimlerini almıştır. 

Big Data Nedir | Bileşenler:

1- Variety (Çeşitlilik):

Big data‘nın farklı farklı teknolojilerin farklı formatlarda, büyük oranda yapısal olmayan çok çeşitli verilerden oluşmasını ifade etmektedir. Üretilen verinin yüzde 70’i yapısal olmadığı gibi işlevsel de değil ve her yeni üretilen teknoloji, farklı formatlarda veri üretebiliyor. Her yeni üretilen teknolojik bir ürünün veri tipi ile ilgilenilmesi gerekiyor. Telefonlar ve tabletler bütünleşik devreler oluşturdukları için türlü türlü verilerle big data‘nın büyümesine büyük etki etmektedirler. 

2- Velocity (Hız):

Big datanın üretilme hızının çok yüksek olmasını ifade etmektedir. Büyük Veri’nin üretilme hızı ne kadar çok yüksek ise o kadar da hızlı  bir şekilde artıyor olması ürkütücüdür. Yukarıda da belirttiğim gibi big data (dev veri – büyük veri) gittikçe artan baş döndürücü bir hızla büyümeye devam etmektedir. 

3- Volume (Hacim – Veri Büyüklüğü):

Big data’nın büyüklüğüne dikkat çekmek için oluşturulan bileşendir. Hızla veri büyüklüğü artarken insanların akıllarına bu konuyla ilgili tek bir soru geliyor. ”Veri büyüklüğü bu denli bir hızlı ilerlerken gelecek günlerde bu verileri nasıl işleyecekler?  Nasıl koruyacaklar?” Bazı kurumlar gelecek için çalışmalar yapsa bile şuan için dev verileri korumak, işlemek ve hatta analiz etmek için aktif bir çalışma sonucuna ulaşamamışlardır. 

4- Verification (Doğrulama):

Bilgi akışı sırasındaki verinin “güvenli” olması için oluşturulan bir bileşendir. Doğrulama sadece doğru kişiler tarafından  takip edilmeli ve görülebilmelidir. Gizliliğin en üst seviyede olduğu bileşendir. Yanlış kişiler tarafından bu bileşen ele geçirilirse veriler internet ortamına sızdırılır veya data veri olarak satışı sağlanır. 

5- Value (Değer):

Son ve en önemli bileşendir. Önemi değer yaratmasından kaynaklanıyor. Bütün verilerin kurum ve kuruluşlar için artı bir değer katması gerekiyor. Value bunu sağlıyor. Bir nevi karar mekanizması olarak çalışan bir bileşendir. Value bileşeninin örneği şu şekildedir; ”Bir banka, kredi vereceği kişinin, sadece demografik bilgilerini değil, yemek yeme, tatil yapma alışkanlıklarını dahi izleyebilmeli, gerekirse sosyal ağlarda ne yaptığını görebilmeli.” mantığı ile çalışır. 

Big Data’nın Kullanım Alanları:

  • Hastaneler daha iyi bir hizmet verebilmek ve hastaların sorunlarını daha iyi bir şekilde analiz edebilmek için hastaların verilerini depolarlar. Fakat konusu açılmışken bu konuya da değinelim: Verilerin güvenli bir şekilde saklandığını tabii ki hastaneye sorabilirsiniz.
  • Sosyal medya paylaşımlarının hızla artmasıyla 1 gün içerisinde milyarlarca byte elde ediliyor. 
  • Twitter’ın günlük işlenen veri boyutu: 9 terabyte’a yaklaşmakta ve günden güne artmaktadır. Hatta Twitter, 2021 yılını en çok depolama alanına ihtiyaç duyduğu yıl olarak tanımlamıştır.
    Arama motorları sayesinde milyonlarca sayfa arasında en doğru ve en hızlı veriye ulaşabilmemiz için yine aynı şekilde arka tarafdaki büyük veriler ve bunların anlamlı hale getirilmeleri yatmaktadır.
  • Bankaların kullanıcılarının verilerini sakladıktan sonra kişilerin online işlem yapmalarını bu veriler sayesinde incelemesi mümkün. Ayrıca kullanıcılarına SMS veya Mail de gönderebilmesi mümkün.
  • Enerji firmaları, akıllı şebeke ve sayaçlar kullanarak, abonelerinin bireysel kullanımlarıyla ilgili oluşan verileri, saklayıp, işlemek durumundalar.

Petabyte: Bilgisayarlarda kullanılan, 1024 terebayt anlamına gelen bir veri büyüklüğü birimidir.

Exabyte: Bilgisayarlarda kullanılan, 1024 petabayt anlamına gelen bir veri büyüklüğü birimidir.

Zettabyte: Exabyte ‘tan bir büyük bilgisayar depolama birimidir. 1024 exabyte büyüklüğündedir. Fakat atlamayalım: Bu depolama alanlarını normal bilgisayar kullanıcıların görmesi pek mümkün değil. Özellikle ekonomik şartlar bu durumdayken normal bir bilgisayarı görmemiz de aslında pek mümkün değil.

Big Data Madenciliği | Büyük Veri Madenciliği:

Donanım, veri, bilgisayar sistemlerinin değişimi veri madenciliği sistemini de tamamen değiştirmektedir. Bilim ve teknoloji alanında büyük veri madenciliği hızla gelişirken aynı zamanda büyük bir artış göstermektedir.

Büyük veri teknikleri;

  • İstatistik
  • Veri madenciliği
  • Makine öğrenmesi
  • Optimizasyon teknikleri
  • Sosyal ağ analizi
  • Sinyal işleme
  • Örüntü tanıma ve görselleştirme yaklaşımları gibi birçok disiplini kapsıyor.

İlgili: İngiltere ve ABD’deki Netflix İçerikleri Ücretsiz Olarak İzleyebilirsin!

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.

aimedis-nedir-sekuritance-aimedis-hakkında

Sekuritance, Aimedis’in İlk IDO’sunu Tamamladı! Sağlık Sistemi Değişebilir!

parola güvenliği - parola güvenliği nasıl sağlanır - parola güvenliği için - lorentlabs

Parola Güvenliği Nasıl Sağlanır? Parolam Güvenli Mi?