Dijital Pazarlamada Sosyal Medyanın Önemi
Growth Hacking ve Growth Hacker Nedir?
- RegEx Nedir?
- RegEx Meta Karakterleri Nelerdir?
- RegEx Yer Değiştirme Karakterleri Nelerdir?
- RegEx. Karakter Sınıfları Nelerdir?
Herhangi bir metni eşleştirmede, bulmada ya da yönetmede yardımcı olacak desenler yaratmaya izin veren birçok karakter ve sembollerin bir araya gelmesiyle oluşan metin dizesine regular expression yani regex denir . Yani düzenli ifadeler, metinlerde aranan bir tümceyi kolayca bulmamızı sağlayan bir çeşit algoritmadır. Yani uzun tümcelerde bulmayı istediğimiz tümceciği kullanacağımız desenlerle bulmamızı sağlar.
Birçok veri bilimi uzmanı, analisti ve programcısı bir noktada düzenli ifadelerle uğraşmak zorundadır.
RegEx evrenseldir ve neredeyse tüm veri türlerini işleyebilir. SQL, Python, R, Tableau, Java, ve .NET gibi çeşitli veri analiz platformları ve programlama dilleri bunları destekler.
RegEx sayesinde bir kampanya içerisinde marka kelime/kelimeleri ya da marka kelime/kelimeleri ayırt etmek için teker teker tarıyorsanız, analizlerinizi daha hızlı hale getirmek için kullanabilirsiniz.
Reg Ex. Meta Karakterler;
Dikey Çizgi: Dikey çizgi, Analytics ile çalışırken çok sık kullanılmakta olan bir ifade. Bir çok normal ifade Analytics’in sunduğu varsayılan seçeneklerle değiştirilebilir fakat yine de dikey çizgiyi kullanmak zaman kaybından en aza indirger.
Nokta: Tek bir karakteri ifade eder. Bulunduğu yere her şey gelebilir. Örnek: .at — kat, sat vs.
Yıldız “*” : Kendinden bir önceki ifadeyi yok sayar veya tekrarlanan bir biçimde kullanılmasını sağlar.
Artı: Kendinden bir önceki ifadenin bir veya birden fazla bir şekilde eşleşmesini sağlar. Örnek: merhaba+ — merhabalar, merhabaaa vs.
Ters Çizgi: Ters eğik çizgi çok önemli ve yararlı bir işarettir ve unutmamamız gerekir. RegEx karakterini başka bir anlamı olmayan normal bir karaktere “dönüştürmek istediğimizde kullanırız. Örneğin: 216\.335\.128\.120 – yazdığımız durumda normal ifade yalnızca 216.335.128.120 IP’siyle eşleşir.
Düzeltme İşareti: Satır başını ifade eder. Şununla başlayan anlamına gelir.
Dolar İşareti: Satır sonunu ifade eder. Şununla biten anlamına gelir.
Soru İşareti: Kendinden önceki karakterin stringde olmasını ya da olmamasını sağlar. Genelde yazım hatalarını görebilmek için eklenir.
Parantez İşareti: Parantezlerin içeriği bir öğe olarak tanımlanır.
Köşeli Parantez: Köşeli parantez içerisindeki karakterlerin biri ile eşleşir.
Reg Ex. Yer Değiştirme Karakterleri;
“$number” : Ondalık bir numaraya sahip olan grupla eşleşmiş son alt katarın yerine geçer.
“${name}” : Bir grupla eşleşmiş son alt katarın yerine geçer.
“$$” : Bir “$” işaretinin yerine geçer.
“$&” : Bütün bir eş kopyasının yerine geçer.
“$`” : Bütün bir katar girdisinin yerine eşleşmeden önce geçer.
“$'” : Bütün bir katar girdisinin yerine eşleşmeden sonra geçer.
“$+” : Tutulmuş son grubun yerine geçer.
“$_” : Bütün bir katar girdisinin yerine geçer.
Reg Ex. Karakter Sınıfları;
“\p{isim}”: Her türlü “Unicode” kategorideki isimle eşleşir. Örnek olarak, “Ll, Lu, Nd, Z, IsGreek” gibi “Unicode” isimlerle eşleşir.
“\P{isim}”: Her türlü “Unicode” kategoride olmayan isimle eşleşir.
“\w” : Bütün sözcüklerle eşleşir. Örnek olarak şu “Unicode” kategoriye denktir: “[\p{Ll}\p{Lu}\p{Lt}\p{Lo}\p{Nd}\p{Pc}\p{Lm}]“ veya “Unicode” kategoride olmayan şu karakterlere de denk gelir: “[a-zA-Z_0-9]”.
“\W”: Sözcük olmayan bütün karakterlerle eşleşir. Şu “Unicode” kategoriye denk gelir: “[^\p{Ll}\p{Lu}\p{Lt}\p{Lo}\p{Nd}\p{Pc}\p{Lm}]”, ayrıca şu ifadeye de denktir: “[^a-zA-Z_0-9]”.
“\d” : Bütün ondalık sayılara eşlenir. “Unicode” kategoride şuna denktir: “\p{Nd}”. Ayrıca “[0-9]” ifadesine de denk gelir.
Yukarıda anlatılan özel karakterlerin katara atanması için “@” işareti kullanılır. .Net içinde düzenli ifadeleri kullanabilmek için “System.Text.RegularExpressions” isim uzayı kullanılır. Bu isim uzayı içinde “Regex” sınıfı yardımıyla nesne üretilir.
“Regex” sınıfının 7 ayrı metodu vardır. Bunlar:
Escape: Meta karakterleri katar içinden çıkarır.
Unescape: “Escape” metoduyla katardan çıkarılmış karakterleri tekrar katar içine alır.
IsMatch: Düzenli ifadenin (regular expression) bir katarla eşleşip eşleşmediğini doğru ya da yanlış olarak (boolean) döner.
Match: Eşleşmiş düzenli ifadeyi (regular expressions) döner.
Matches: Eşleşmiş düzenli ifadeleri (regular expressions) bir liste şeklinde döner.
Replace: Eşleşmiş düzenli ifadeleri (regular expressions) eşleştiği katarla yer değiştirir.
Split: Düzenli ifadeler (regular expressions) ile tanımlanmış katarların dizisini döner. Düzenli ifadeler (regular expressions) genellikle bir metin içinden e-posta adresi, telefon numarası veya tarih gibi ifadeleri çekmek için kullanılır. Bütün bu ifadelerin düzenli ifadeler (regular expressions) içindeki desenlerinin basit birer örneği aşağıda verilmiştir:
E-posta deseni: “^[\w-\.]+@([\w-]+\.)+[\w-]{2,4}$”
Telefon numarası deseni: “0\([0-9]{3}\)-[0-9]{3}-[0-9]{2}-[0-9]{2}”
Tarih deseni: “^\d{1,2}\/\d{1,2}\/\d{4}$”