top of page
kisspng-google-analytics-data-analysis-b

التنبؤ بالبيانات

               

 R تعد لغة 

من اللغات التي صعد نجمها حديثا وبشكل سريع بمجال البرمجة

العلمية في قطاعي الإحصاء والمعلومات الحيوية

حيث باتت معتمدة على نطاق واسع في كثير من الجامعات ومراكز البحث العلمية، وأصبحنا نرى استخدامها والإشارة إليها في المقالات المنشورة بالمجلات العلمية المحكّمة يزداد بشكل طردي  ومتسارع , هذا عدى عن حقيقة كونها لغة حرة مفتوحة المصدر .

RStudio-Logo.png

 قراءة البيانات من الملفات              

يحتوي الآر على أوامر تسمح لك بقراءة البيانات من الملفات وتحميلها على شكل جداول في العادة النوع  الأكثر استعمالا من البيانات هي الملفات النصية حيث تكون فواصل بين الحقول (مثلا فراغ , نقطة ،فاصلة,...إلخ) أو ملفات برامج الجدولة ( اكسل مثلا)  محفوظة على شكل (سي . اس . في) 

يوفر الآر دالتين لقراءة هذا النوع من البيانات, دالة

read.table

التي تسمح بقراءة الملفات النصية وتعطيك تحكما تاما في كيفية القراءة. مثلاً يمكنك أن تخبرها أن السطر الأول يمثل اسم الأعمدة وأن الحقول مفصولة بينها بفراغات بمفتاح

Tab وليس Space.

في هذا المقال سوف نأخذ كمثال مجموعة بيانات من عملاء امازون تحتوي على تقيممات النجوم وتاريخ المراجعة وملاحضاتهم  لتحليل البيانات وتحليل مشاعرهم 

Screen Shot 1441-11-18 at 12.03.57 AM.pn

البيانات المستخدمة

data

Screen Shot 1441-11-18 at 2.13.55 AM.png

لرؤية أهم 10 أسطر من مخطط بيانات 

إذا كان حجم البيانات كبيرا من الأفضل استعمال أمر

head

 لاظهار الأسطر الأولى من الملف, في العادة للتأكد من أن القراءة تمت بالشكل الصحيح. يمكن أيضا 

 .dim معرفة عدد الأسطر وعدد الأعمدة باستعمال أم

يمكننا استعمال هذه الأوامر للتعرف على رسم الكلمات الأكثر شيوعاً في عامود ملاحظات العملاء :

استعمال هذه الأوامر للتعرف على عدد الكلمات المرتبطة بكل شعور

Screen Shot 1441-11-18 at 12.14.09 AM.pn
Screen Shot 1441-11-18 at 12.28.59 AM.pn
Rplot2.png

بعد ان تعرفنا على لغة ار سنتطرق الى مثال توضيحي حول كيفية التنبؤ بالبيانات

Rplot1.png

استعمال هذه الأوامر للتعرف على عدد الكلمات المرتبطة بكل شعور

الأمثلة

  • Twitter
  • YouTube
bottom of page