Tรผrkiye ฤฐstatisik Kurumu (TรฤฐK), internet รผzerinden satฤฑลฤฑ her geรงen gรผn artan bazฤฑ รผrรผnlerin fiyatฤฑnฤฑ da enflasyon hesaplamasฤฑnda dikkate alacak.
Bloomberg‘in haberine gรถre TรฤฐK’ten edinilen bilgiye gรถre, internet รผzerinden mal ve hizmet satฤฑn alฤฑmlarฤฑ her geรงen gรผn daha da yaygฤฑnlaลฤฑrken istatistik ofislerinin sรถz konusu zengin veri kaynaฤฤฑnฤฑ gรถz ardฤฑ etmemesi รถnem taลฤฑyor. ฤฐnternet fiyatlarฤฑnฤฑn TรFE’ye entegre edilmesinin gerekli hale geldiฤi deฤerlendirilirken, bรถylece istatistik รผretiminde veri derleme sฤฑklฤฑฤฤฑnฤฑn daha yรผksek ve daha bรผyรผk hacimli olmasฤฑ hedefleniyor. Sรถz konusu verilerin mevcut yapฤฑyฤฑ geliลtirmek ve yeni deฤiลkenleri elde etmek iรงin bรผyรผk bir fฤฑrsat sunduฤu dรผลรผnรผlรผyor.
Otomatik olarak bir web kaynaฤฤฑndan veri derlemeye veri kazฤฑma (web scraping) deniliyor. Bu genellikle bir kazฤฑyฤฑcฤฑ (scraper) yardฤฑmฤฑyla oluyor ve daha geliลmiล istatistiksel analizler iรงin ham veriyi derleyip temizliyor.
Otomatik veri kazฤฑma teknolojilerini kullanarak gรผnlรผk, saatlik ve hatta daha yรผksek sฤฑklฤฑkta veri yapฤฑsฤฑyla optimal veri derleme stratejileri elde edilebiliyor. Bรถylece, detaylฤฑ metaveri bilgileri derlenerek hesaplamalar geliลtirilebiliyor. Bu yรถntemde genel amaรง, web sitesinde yer alan HTML formatฤฑndaki bilgiyi analiz ve hesaplamalar iรงin daha uygun yapฤฑlara dรถnรผลtรผrmek.
Bu yรถntemde, uygun web sitesi seรงimi iรงin bazฤฑ kriterler de aranฤฑyor. Bunun iรงin sitenin temsiliyet, hacim, iรงerik kaynaฤฤฑ, sรผrdรผrรผlebilirliฤi, teknik รถzellikleri, metaveri ve hedef deฤiลkenleri gibi unsurlara bakฤฑlฤฑyor.
TรฤฐK, internetten veri kazฤฑma รงalฤฑลmalarฤฑ kapsamฤฑnda 2020 yฤฑlฤฑnda TรBฤฐTAK ile ortaklaลa TรฤฐK Bรผyรผk Veri ฤฐleri Analitik Projesi’ni gerรงekleลtirdi. Veri kaynaklarฤฑ olan firmalardan gerekli izinler alฤฑnarak, internetten veri kazฤฑma fiyat derleme yรถnteminin altyapฤฑsฤฑ hazฤฑrlandฤฑ.
Proje sonucu gelen ham veri, TรฤฐK teknik personeli tarafฤฑndan analiz edildi, hatalar belirlendi ve fiyat derlenebilecek hale getirildi. Daha sonra verinin tablo formatฤฑnda, fiyat takibi yapฤฑlabilir ve veri analizine uygun olmasฤฑ saฤlandฤฑ.
Fiyatฤฑ yฤฑl boyunca izlenecek
Beyaz eลya, elektronik รผrรผnler, mobilya, birinci el otomobiller ve otobรผs bileti fiyatlarฤฑ iรงin 2022 yฤฑlฤฑ itibarฤฑyla internet รผzerinden derlenen fiyatlar endeks hesaplamalarฤฑnda kullanฤฑlacak. Aralฤฑk ayฤฑ temel alฤฑnarak takibi kararlaลtฤฑrฤฑlan รผrรผnlerin fiyatฤฑ, รผrรผn kodu ya da รผrรผn barkodu รผzerinden yฤฑl boyunca takip edilecek. Bรถylece aynฤฑ kalitedeki รผrรผnlerin fiyat geliลimleri endeks hesaplamalarฤฑna yansฤฑtฤฑlacak. Bu kapsamdaki fiyatlarฤฑn sayฤฑsฤฑ aylฤฑk yaklaลฤฑk 20 bin civarฤฑnda.
Veri kazฤฑma yoluyla elde edilen bilgiler gรผnlรผk olarak takip edilerek fiyat deฤiลim analizleri de yapฤฑlฤฑyor. Ayrฤฑca fiyatฤฑ gelen รผrรผnlerin satฤฑลฤฑnฤฑn devamlฤฑlฤฑฤฤฑ da fiyat derleme dรถnemi iรงindeki fiyat sayฤฑlarฤฑ kontrol edilerek gรถzleniyor.
ฤฐnternet verisinin kullanฤฑmฤฑ yaygฤฑnlaลtฤฑrฤฑlacak
Gelecek dรถnemde yeni sisteme adapte edilen รผrรผn fiyatlarฤฑnฤฑn gรผnlรผk olarak veri akฤฑลฤฑ saฤlanacak, analizleri yapฤฑlacak ve diฤer veri derleme yรถntemleri olan barkod ve alan verisiyle birlikte fiyat derleme dรถneminin sonunda endeks hesaplamalarฤฑnda kullanฤฑlacak. TรFE kapsamฤฑnda derlenen aylฤฑk fiyatlarฤฑn yaklaลฤฑk olarak yรผzde 40-45’i barkod ve internetten veri kazฤฑmayla elde edilmiล olacak ve bรถylece veri, kaynaฤฤฑnda mรผmkรผn olan en doฤru haliyle derlenecek.
TรฤฐK, bu kapsamda en az maliyetle en doฤru veriyi elde edebilecek. Bu hedef doฤrultusunda diฤer รผlke รงalฤฑลmalarฤฑ da dikkate alฤฑnarak barkod ve internet verilerinin kullanฤฑmฤฑnฤฑn yaygฤฑnlaลtฤฑrฤฑlmasฤฑ รถngรถrรผlรผyor.







