Data Mining and Statistics in Data Science

Author:

Year-Number: 2019-30
Number of pages: 960-968
Mendeley EndNote Alıntı Yap

Abstract

Büyük veri, günümüzde oldukça sık duyulan bir kavram haline gelmiştir. Büyük veri, anlamlı ve anlamsız verilerin bir arada bulunduğu yapı olarak da tanımlanmaktadır. Günümüz teknolojisi hızla ilerlemekte iken verinin gücü de her geçen gün artmakta ve büyük veri ile sıkça karşılaşılmaktadır. Bu nedenle, veri boyutlarında meydana gelen artış klasik istatistiksel yöntemlerin yetersiz kalabileceği durumlara neden olmaktadır. Veri yığınları arasından anlamlı ve işe yarayacak nitelikte olan bilgilerin elde edilebilmesi için veri analizinin önemi her geçen gün daha da artmaktadır. Veri analizinde istatistiğin amacı, verilerin anlamlandırılmasıdır. İstatistiksel yöntemler yaygın olarak kullanılsa da, veri analizinde, temeli istatistiksel yöntemlere dayanan veri madenciliği, büyük verilerin analiz edilmesine olanak sağlamaktadır. Veri madenciliği süreçlerinde istatistiksel yöntemlerin yaygın olarak kullanılması, istatistik ile veri madenciliğinin birbirinden ayrı tutulamayacağı gerçeğini açıklamaktadır.

Keywords

Abstract

In parallel with the developing technology of modern age, there has been a corresponding increase in computer domains that possess data storage function. Therefore, methods which allow storing large data gained an equally grave attention. In this study some of the most popular data analysis methods, namely data mining and statistical methods, have been investigated. The aim of this study is to exhibit the correlation between data mining and statistics. To achieve this aim, firstly data mining process has been explored. Next the need to implement statistical methods during this process has been accentuated.

Keywords