Veri madenciliği, kalıpları ve diğer bilgileri keşfetmek için büyük miktarda veriyi analiz etme sürecidir . Genellikle verileri yapılandırılmış bir biçimde depolayan veritabanlarında gerçekleştirilir . Büyük miktarda veriyi "madencilik" yaparak, gizli bilgiler keşfedilebilir ve başka amaçlar için kullanılabilir.
Veri Madenciliği Örnekleri
Bir kredi kartı şirketi, üyelerinin satın alma alışkanlıkları hakkında daha fazla bilgi edinmek için veri madenciliğini kullanabilir. Amerika Birleşik Devletleri genelinde kart sahiplerinden yapılan satın alımları analiz ederek, şirket yaş, yarış ve konum gibi farklı demografik bilgiler için alışveriş alışkanlıkları bulabilir. Bu bilgi, bireylere özel promosyonlar sunmada faydalı olabilir. Aynı veriler, ülkenin farklı bölgelerinde alışveriş alışkanlıklarını da ortaya çıkarabilir. Bu bilgiler, belirli eyaletlerde reklam vermek veya iş kurmak isteyen şirketler için değerli olabilir.
Google ve Facebook gibi çevrimiçi hizmetler, kullanıcılarına hedefli içerik ve reklamlar sunmak için çok büyük miktarda veriye sahiptir. Örneğin Google, belirli alanlarda popüler aramaları keşfetmek ve bunları otomatik tamamlama listesinin en üstüne (yazarken görünen öneriler) taşımak için arama sorgularını analiz edebilir . Facebook, kullanıcı etkinlik verilerini kullanarak, farklı yaş grupları arasında popüler konuları keşfedebilir ve bu bilgilere dayanarak hedeflenmiş reklamlar sağlayabilir.
Veri madenciliği yaygın olarak pazarlama amacıyla kullanılsa da, başka birçok kullanıma da sahiptir. Örneğin, sağlık şirketleri belirli genler ve hastalıklar arasındaki bağlantıları keşfetmek için veri madenciliğini kullanabilir. Hava durumu şirketleri gelecekteki meteorolojik olayları tahmin etmenize yardımcı olabilecek hava durumu modellerini keşfetmek için verileri kullanabilir. Trafik yönetimi kurumları, gelecekteki trafik seviyelerini tahmin etmek ve otoyollar ve caddeler için uygun planlar oluşturmak için otomotiv verilerini kullanabilir.
Veri Madenciliği Gereklilikleri
Veri madenciliği iki şey gerektirir - çok fazla veri ve çok fazla bilgi işlem gücü. Veriler ne kadar organize olursa, yararlı bilgiler için veri o kadar kolay olur. Bu nedenle, veri madenciliğine katılmak isteyen herhangi bir kuruluşun, hangi verilerin kaydedileceğini ve nasıl depolanacağının seçilmesinde proaktif olması önemlidir. Verileri incelemeye gelince, süperbilgisayarlar ve bilgi işlem kümeleri veri petabaytlarını işlemek için kullanılabilir .
Data mining is the process of analyzing large amounts of data in order to discover patterns and other information. It is typically performed on databases, which store data in a structured format. By "mining" large amounts of data, hidden information can be discovered and used for other purposes.
Data Mining Examples
A credit card company might use data mining to learn more about their members' buying habits. By analyzing purchases from cardholders across the United States, the company may discover shopping habits for different demographics, such as age, race, and location. This information could be useful in offering individuals specific promotions. The same data may also reveal shopping patterns in different regions of the country. This information could be valuable to companies looking to advertise or start businesses in specific states.
Online services, such as Google and Facebook, mine enormous amounts of data to provide targeted content and advertisements to their users. Google, for example, might analyze search queries to discover popular searches for certain areas and move those to the top of the autocomplete list (the suggestions that appear as you type). By mining user activity data, Facebook might discover popular topics among different age groups and provide targeted ads based on this information.
While data mining is commonly used for marketing purposes, it has many other uses as well. For instance, healthcare companies may use data mining to discover links between certain genes and diseases. Weather companies can mine data to discover weather patterns that may help predict future meteorologic events. Traffic management institutions can mine automotive data to forecast future traffic levels and create appropriate plans for highways and streets.
Data Mining Requirements
Data mining requires two things — lots of data and lots of computing power. The more organized the data, the easier it is to mine it for useful information. Therefore it is important for any organization that wants to engage in data mining to be proactive in selecting what data to log and how to store it. When it comes to mining the data, supercomputers and computing clusters may be used to process petabytes of data.
Veri Madenciliği Örnekleri
Bir kredi kartı şirketi, üyelerinin satın alma alışkanlıkları hakkında daha fazla bilgi edinmek için veri madenciliğini kullanabilir. Amerika Birleşik Devletleri genelinde kart sahiplerinden yapılan satın alımları analiz ederek, şirket yaş, yarış ve konum gibi farklı demografik bilgiler için alışveriş alışkanlıkları bulabilir. Bu bilgi, bireylere özel promosyonlar sunmada faydalı olabilir. Aynı veriler, ülkenin farklı bölgelerinde alışveriş alışkanlıklarını da ortaya çıkarabilir. Bu bilgiler, belirli eyaletlerde reklam vermek veya iş kurmak isteyen şirketler için değerli olabilir.
Google ve Facebook gibi çevrimiçi hizmetler, kullanıcılarına hedefli içerik ve reklamlar sunmak için çok büyük miktarda veriye sahiptir. Örneğin Google, belirli alanlarda popüler aramaları keşfetmek ve bunları otomatik tamamlama listesinin en üstüne (yazarken görünen öneriler) taşımak için arama sorgularını analiz edebilir . Facebook, kullanıcı etkinlik verilerini kullanarak, farklı yaş grupları arasında popüler konuları keşfedebilir ve bu bilgilere dayanarak hedeflenmiş reklamlar sağlayabilir.
Veri madenciliği yaygın olarak pazarlama amacıyla kullanılsa da, başka birçok kullanıma da sahiptir. Örneğin, sağlık şirketleri belirli genler ve hastalıklar arasındaki bağlantıları keşfetmek için veri madenciliğini kullanabilir. Hava durumu şirketleri gelecekteki meteorolojik olayları tahmin etmenize yardımcı olabilecek hava durumu modellerini keşfetmek için verileri kullanabilir. Trafik yönetimi kurumları, gelecekteki trafik seviyelerini tahmin etmek ve otoyollar ve caddeler için uygun planlar oluşturmak için otomotiv verilerini kullanabilir.
Veri Madenciliği Gereklilikleri
Veri madenciliği iki şey gerektirir - çok fazla veri ve çok fazla bilgi işlem gücü. Veriler ne kadar organize olursa, yararlı bilgiler için veri o kadar kolay olur. Bu nedenle, veri madenciliğine katılmak isteyen herhangi bir kuruluşun, hangi verilerin kaydedileceğini ve nasıl depolanacağının seçilmesinde proaktif olması önemlidir. Verileri incelemeye gelince, süperbilgisayarlar ve bilgi işlem kümeleri veri petabaytlarını işlemek için kullanılabilir .
Data mining is the process of analyzing large amounts of data in order to discover patterns and other information. It is typically performed on databases, which store data in a structured format. By "mining" large amounts of data, hidden information can be discovered and used for other purposes.
Data Mining Examples
A credit card company might use data mining to learn more about their members' buying habits. By analyzing purchases from cardholders across the United States, the company may discover shopping habits for different demographics, such as age, race, and location. This information could be useful in offering individuals specific promotions. The same data may also reveal shopping patterns in different regions of the country. This information could be valuable to companies looking to advertise or start businesses in specific states.
Online services, such as Google and Facebook, mine enormous amounts of data to provide targeted content and advertisements to their users. Google, for example, might analyze search queries to discover popular searches for certain areas and move those to the top of the autocomplete list (the suggestions that appear as you type). By mining user activity data, Facebook might discover popular topics among different age groups and provide targeted ads based on this information.
While data mining is commonly used for marketing purposes, it has many other uses as well. For instance, healthcare companies may use data mining to discover links between certain genes and diseases. Weather companies can mine data to discover weather patterns that may help predict future meteorologic events. Traffic management institutions can mine automotive data to forecast future traffic levels and create appropriate plans for highways and streets.
Data Mining Requirements
Data mining requires two things — lots of data and lots of computing power. The more organized the data, the easier it is to mine it for useful information. Therefore it is important for any organization that wants to engage in data mining to be proactive in selecting what data to log and how to store it. When it comes to mining the data, supercomputers and computing clusters may be used to process petabytes of data.