instagram twitter linkedin github youtube

18.5.19

Data Science - Veri Bilimi

Veri bilimi veri çalışmasıdır . Faydalı bilgileri etkin bir şekilde çıkarmak için veri kaydetme, saklama ve analiz etme yöntemlerini geliştirmeyi içerir. Veri biliminin amacı hem yapılandırılmış hem de yapılandırılmamış her türlü veriden içgörü ve bilgi elde etmektir.

Veri bilimi bilgisayar bilimi ile ilgilidir , ancak ayrı bir alandır. Bilgisayar bilimi, verileri kaydetmek ve işlemek için programlar ve algoritmalar oluşturmayı içerirken, veri bilimi, bilgisayarları kullanabilen veya kullanamayan her türlü veri analizini kapsar. Veri bilimi, verilerin toplanması, düzenlenmesi, analizi ve sunumunu içeren İstatistik matematik alanıyla daha yakından ilgilidir.

Modern şirketler ve kuruluşların sahip olduğu büyük miktarda veri nedeniyle, veri bilimi BT'nin ayrılmaz bir parçası haline geldi . Örneğin, kullanıcı verileri petabayta sahip bir şirket, verileri depolamak, yönetmek ve analiz etmek için etkili yöntemler geliştirmek için veri bilimini kullanabilir. Şirket, testler yapmak ve kullanıcıları hakkında anlamlı bilgiler sağlayabilecek sonuçları almak için bilimsel yöntemi kullanabilir.

Veri Bilimi ve Veri Madenciliği
Veri bilimi sıklıkla veri madenciliği ile karıştırılmaktadır . Bununla birlikte, veri madenciliği, veri biliminin bir alt kümesidir. Modelleri ve diğer faydalı bilgileri keşfetmek için büyük miktarda veriyi ( büyük veriler gibi ) analiz etmeyi içerir . Veri bilimi, tüm veri toplama ve işleme kapsamını kapsar.

Data science is the study of data. It involves developing methods of recording, storing, and analyzing data to effectively extract useful information. The goal of data science is to gain insights and knowledge from any type of data — both structured and unstructured.

Data science is related to computer science, but is a separate field. Computer science involves creating programs and algorithms to record and process data, while data science covers any type of data analysis, which may or may not use computers. Data science is more closely related to the mathematics field of Statistics, which includes the collection, organization, analysis, and presentation of data.

Because of the large amounts of data modern companies and organizations maintain, data science has become an integral part of IT. For example, a company that has petabytes of user data may use data science to develop effective ways to store, manage, and analyze the data. The company may use the scientific method to run tests and extract results that can provide meaningful insights about their users.

Data Science vs Data Mining
Data science is often confused with data mining. However, data mining is a subset of data science. It involves analyzing large amounts of data (such as big data) in order to discover patterns and other useful information. Data science covers the entire scope of data collection and processing.

Data Mining

Veri madenciliği, kalıpları ve diğer bilgileri keşfetmek için büyük miktarda veriyi analiz etme sürecidir . Genellikle verileri yapılandırılmış bir biçimde depolayan veritabanlarında gerçekleştirilir . Büyük miktarda veriyi "madencilik" yaparak, gizli bilgiler keşfedilebilir ve başka amaçlar için kullanılabilir.

Veri Madenciliği Örnekleri
Bir kredi kartı şirketi, üyelerinin satın alma alışkanlıkları hakkında daha fazla bilgi edinmek için veri madenciliğini kullanabilir. Amerika Birleşik Devletleri genelinde kart sahiplerinden yapılan satın alımları analiz ederek, şirket yaş, yarış ve konum gibi farklı demografik bilgiler için alışveriş alışkanlıkları bulabilir. Bu bilgi, bireylere özel promosyonlar sunmada faydalı olabilir. Aynı veriler, ülkenin farklı bölgelerinde alışveriş alışkanlıklarını da ortaya çıkarabilir. Bu bilgiler, belirli eyaletlerde reklam vermek veya iş kurmak isteyen şirketler için değerli olabilir.

Google ve Facebook gibi çevrimiçi hizmetler, kullanıcılarına hedefli içerik ve reklamlar sunmak için çok büyük miktarda veriye sahiptir. Örneğin Google, belirli alanlarda popüler aramaları keşfetmek ve bunları otomatik tamamlama listesinin en üstüne (yazarken görünen öneriler) taşımak için arama sorgularını analiz edebilir . Facebook, kullanıcı etkinlik verilerini kullanarak, farklı yaş grupları arasında popüler konuları keşfedebilir ve bu bilgilere dayanarak hedeflenmiş reklamlar sağlayabilir.

Veri madenciliği yaygın olarak pazarlama amacıyla kullanılsa da, başka birçok kullanıma da sahiptir. Örneğin, sağlık şirketleri belirli genler ve hastalıklar arasındaki bağlantıları keşfetmek için veri madenciliğini kullanabilir. Hava durumu şirketleri gelecekteki meteorolojik olayları tahmin etmenize yardımcı olabilecek hava durumu modellerini keşfetmek için verileri kullanabilir. Trafik yönetimi kurumları, gelecekteki trafik seviyelerini tahmin etmek ve otoyollar ve caddeler için uygun planlar oluşturmak için otomotiv verilerini kullanabilir.

Veri Madenciliği Gereklilikleri
Veri madenciliği iki şey gerektirir - çok fazla veri ve çok fazla bilgi işlem gücü. Veriler ne kadar organize olursa, yararlı bilgiler için veri o kadar kolay olur. Bu nedenle, veri madenciliğine katılmak isteyen herhangi bir kuruluşun, hangi verilerin kaydedileceğini ve nasıl depolanacağının seçilmesinde proaktif olması önemlidir. Verileri incelemeye gelince, süperbilgisayarlar ve bilgi işlem kümeleri veri petabaytlarını işlemek için kullanılabilir .

Data mining is the process of analyzing large amounts of data in order to discover patterns and other information. It is typically performed on databases, which store data in a structured format. By "mining" large amounts of data, hidden information can be discovered and used for other purposes.

Data Mining Examples
A credit card company might use data mining to learn more about their members' buying habits. By analyzing purchases from cardholders across the United States, the company may discover shopping habits for different demographics, such as age, race, and location. This information could be useful in offering individuals specific promotions. The same data may also reveal shopping patterns in different regions of the country. This information could be valuable to companies looking to advertise or start businesses in specific states.

Online services, such as Google and Facebook, mine enormous amounts of data to provide targeted content and advertisements to their users. Google, for example, might analyze search queries to discover popular searches for certain areas and move those to the top of the autocomplete list (the suggestions that appear as you type). By mining user activity data, Facebook might discover popular topics among different age groups and provide targeted ads based on this information.

While data mining is commonly used for marketing purposes, it has many other uses as well. For instance, healthcare companies may use data mining to discover links between certain genes and diseases. Weather companies can mine data to discover weather patterns that may help predict future meteorologic events. Traffic management institutions can mine automotive data to forecast future traffic levels and create appropriate plans for highways and streets.

Data Mining Requirements
Data mining requires two things — lots of data and lots of computing power. The more organized the data, the easier it is to mine it for useful information. Therefore it is important for any organization that wants to engage in data mining to be proactive in selecting what data to log and how to store it. When it comes to mining the data, supercomputers and computing clusters may be used to process petabytes of data.

Data management

Veri yönetimi, çok çeşitli veri uygulamalarını kapsayan genel bir terimdir . Temel veri yönetimi kavramlarına veya belirli teknolojilere atıfta bulunabilir. Bazı kayda değer uygulamalar 1) veri tasarımı, 2) veri depolama ve 3) veri güvenliğini içerir.

1. Veri tasarımı veya veri mimarisi, verilerin yapılandırılma şeklini ifade eder. Örneğin, bir uygulama için bir dosya formatı oluştururken , geliştirici dosyadaki verilerin nasıl düzenleneceğine karar vermelidir. Bazı uygulamalar için, verileri bir metin biçiminde saklamak anlamlı olabilirken, diğer programlar ikili dosya biçiminden faydalanabilir . Geliştiricinin hangi biçimi kullandığına bakılmaksızın, veriler dosya içinde, ilişkili program tarafından tanınabilecek bir yapıda düzenlenmelidir.

2. Veri saklama , veri kaydetmenin birçok farklı yolunu ifade eder. Bu, sabit diskleri , flash belleği , optik ortamı ve geçici RAM'i içerirdepolama. Uygun bir veri depolama ortamı seçerken, veri erişimi ve veri bütünlüğü gibi kavramları dikkate almak önemlidir. Örneğin, düzenli olarak erişilen ve değiştirilen veriler sabit sürücüde veya flash ortamlarda saklanmalıdır. Bunun nedeni, bu tür ortamların hızlı erişim sağlaması ve verilerin taşınmasına veya değiştirilmesine izin vermesidir. Öte yandan, arşivlenmiş veriler CD ve DVD gibi optik ortamlarda saklanabilir, çünkü verilerin değiştirilmesi gerekmez. Optik diskler ayrıca veri bütünlüğünü sabit disklerden daha uzun süre korur ve bu da onları arşivleme amaçları için iyi bir seçim yapar.

3. Veri güvenliği , bilgisayar verilerinin korunmasını içerir. Birçok kişi ve işletme bilgisayar sistemlerinde değerli veriler depolar. Hayatınızın bilgisayarınızda depolanmış olduğunu hissetmişseniz, verilerin ne kadar önemli olabileceğini anlarsınız. Bu nedenle, verilerinizin gizliliğini ve bütünlüğünü korumak için adımlar atmak akıllıca olacaktır. Bazı adımlar , bilgisayarınıza yetkisiz erişimi önlemek ve çevrimiçi olarak gönderilen veya diğer kullanıcılarla paylaşılan kişisel verileri şifrelemek için bir güvenlik duvarı yüklemesini içerir . Birincil depolama cihazınızın arızalanması durumunda dosyalarınızı kurtarabilmeniz için verilerinizi yedeklemeniz de önemlidir .
Data management is a general term that covers a broad range of data applications. It may refer to basic data management concepts or to specific technologies. Some notable applications include 1) data design, 2) data storage, and 3) data security.

1. Data design, or data architecture, refers to the way data is structured. For example, when creating a file format for an application, the developer must decide how to organize the data in the file. For some applications, it may make sense to store data in a text format, while other programs may benefit from a binary file format. Regardless of what format the developer uses, the data must be organized within the file in a structure that can be recognized by the associated program.

2. Data storage refers to the many different ways of storing data. This includes hard drives, flash memory, optical media, and temporary RAM storage. When selecting an appropriate data storage medium, concepts such as data access and data integrity are important to consider. For example, data that is accessed and modified on a regular basis should be stored on a hard drive or flash media. This is because these types of media provide quick access and allow the data to be moved or changed. Archived data, on the other hand, may be stored on optical media, such as CDs and DVDs, since the data does not need to be changed. Optical discs also maintain data integrity longer than hard drives, which makes them a good choice for archival purposes.

3. Data security involves protecting computer data. Many individuals and businesses store valuable data on computer systems. If you've ever felt like your life is stored on your computer, you understand how important data can be. Therefore, it is wise to take steps to protect the privacy and integrity of your data. Some steps include installing a firewall to prevent unauthorized access to your computer and encrypting personal data that is submitted online or shared with other users. It is also important to backup your data so that you will be able to recover your files in case your primary storage device fails.

Yorumlayıcı

Tercüman, kodu okuyan ve yürüten bir programdır . Bu, kaynak kodu , önceden derlenmiş kod ve komut dosyalarını içerir . Ortak tercümanlar dahil Perl , Python ve Ruby sırasıyla Perl, Python yürütmek tercümanlar, ve Ruby kodu.

Yorumlayıcı ve derleyiciler benzerdir, çünkü hem kaynak kodu hem tanır hem de işler. Ancak, bir derleyici gibi bir kod çalıştırmaz ve yorumlayıcı yapar. Bunun yerine, bir derleyici kaynak kodunu doğrudan işletim sistemi tarafından çalıştırılabilir bir program olarak çalıştırılabilen makine koduna dönüştürür . Yorumlayıcılar derleme işlemini atlar ve kodu doğrudan yürütür.

Yorumlayıcılar tek bir adımda kodu okuyup çalıştırdığından, komut dosyalarını ve diğer küçük programları çalıştırmak için kullanışlıdır. Bu nedenle, Yorumlayıcılar genellikle geliştiricilerin web sayfalarında çalıştırılabilir komut dosyaları çalıştırmalarını sağlayan Web sunucularına kurulur . Bu komut dosyaları, kodu yeniden derlemeye gerek kalmadan kolayca düzenlenebilir ve kaydedilebilir.

Yorumlayıcılar küçük programlar yürütmek için çeşitli avantajlar sunarken, Yorumlayıcı dillerin de bazı kısıtlamaları vardır. En kayda değer, yorumlanmış kodun gerektirdiği ve yorumlayıcının çalışması gerektiği gerçeğidir. Bu nedenle, bir Yorumlayıcı olmadan, kaynak kod çalıştırılabilir bir programdan ziyade düz bir metin dosyası olarak işlev görür . Ek olarak, bir Yorumlayıcı için yazılmış programlar, yerleşik sistem işlevlerini kullanamayabilir veya derlenmiş programlar gibi donanım kaynaklarına erişemeyebilir. Bu nedenle, çoğu yazılım uygulaması yorumlanmak yerine derlenir.

An interpreter is a program that reads and executes code. This includes source code, pre-compiled code, and scripts. Common interpreters include Perl, Python, and Ruby interpreters, which execute Perl, Python, and Ruby code respectively.

Interpreters and compilers are similar, since they both recognize and process source code. However, a compiler does not execute the code like and interpreter does. Instead, a compiler simply converts the source code into machine code, which can be run directly by the operating system as an executable program. Interpreters bypass the compilation process and execute the code directly.

Since interpreters read and execute code in a single step, they are useful for running scripts and other small programs. Therefore, interpreters are commonly installed on Web servers, which allows developers to run executable scripts within their webpages. These scripts can be easily edited and saved without the need to recompile the code.

While interpreters offer several advantages for running small programs, interpreted languages also have some limitations. The most notable is the fact that interpreted code requires and interpreter to run. Therefore, without an interpreter, the source code serves as a plain text file rather than an executable program. Additionally, programs written for an interpreter may not be able to use built-in system functions or access hardware resources like compiled programs can. Therefore, most software applications are compiled rather than interpreted.

Derleyici

Derleyici, program kaynak kodu dosyalarını çalıştırılabilir bir programda derleyen bir yazılım programıdır. Çoğu programlama yazılımı paketiyle entegre geliştirme ortamı IDE'nin bir parçası olarak dahil edilir .

Derleyici, C , BASIC veya Java gibi yüksek düzeyde bir dilde yazılmış kaynak kod dosyalarını alır ve kodu, makine kodu veya montaj kodu gibi düşük düzeyde bir dilde derler. Bu kod, Intel Pentium veya PowerPC gibi belirli bir işlemci türü için oluşturulur. Program daha sonra işlemci tarafından tanınabilir ve işletim sisteminden çalıştırılabilir .

Bir derleyici kaynak kod dosyalarını bir programa derledikten sonra program değiştirilemez. Bu nedenle, kaynak kodunda herhangi bir değişiklik yapılmalı ve program yeniden derlenmelidir. Neyse ki, çoğu modern derleyici hangi değişikliklerin yapıldığını algılayabilir ve yalnızca programcıları çok fazla zaman kazandıran değiştirilmiş dosyaları yeniden derlemeniz gerekir. Bu, programcıların proje son teslim tarihinden önceki 100 saatlik çalışma haftalarını 90 ya da öylesine düşürmelerini sağlayabilir

A compiler is a software program that compiles program source code files into an executable program. It is included as part of the integrated development environment IDE with most programming software packages.

The compiler takes source code files that are written in a high-level language, such as C, BASIC, or Java, and compiles the code into a low-level language, such as machine code or assembly code. This code is created for a specific processor type, such as and Intel Pentium or PowerPC. The program can then be recognized by the processor and run from the operating system.

After a compiler compiles source code files into a program, the program cannot be modified. Therefore, any changes must be made in the source code and the program must be recompiled. Fortunately, most modern compilers can detect what changes were made and only need to recompile the modified files, which saves programmers a lot of time. This can help reduce programmers' 100 hour work weeks before project deadlines to around 90 or so.