التعدين الصحة العامة في تويتر السعودي
ظهر مرض فيروس كورونا (COVID-19) في أواخر ديسمبر 2019 في الصين وانتشر بسرعة كبيرة في جميع أنحاء العالم، مما دفع معظم الدول إلى فرض إجراءات صارمة للتباعد الاجتماعي وقيود على السفر لاحتواء انتشار الفيروس. غيّر فيروس كورونا حياة عشرات الملايين من الناس ، وجعلهم أكثر قلقا بسبب نقص المعلومات حول هذا الفيروس الجديد. دفع هذا الناس إلى تحويل نقاشهم إلى منصات التواصل الاجتماعي مثل تويتر. لعبت وسائل التواصل الاجتماعي دورًا مهمًا في إطلاع الناس على الوضع الحالي في جميع أنحاء العالم ، مما أدى إلى النمو السريع لمحتوى وسائل التواصل الاجتماعي. يوفر هذا النمو السريع أدوات قيمة لنشر المعلومات التي أصبحت أيضًا أساسًا للمعلومات المضللة والأخبار المزيفة ، مما يجعل من الصعب التمييز بين المعلومات الصحيحة والخاطئة. يعتمد احتواء الفيروس الجديد على جودة وموثوقية المعلومات المشتركة بين الناس ، حيث إن المعلومات الخاطئة بدورها قد تؤثر على فعالية احتواء الفيروس وعلى صحة الأفراد والمجتمعات.تويتر هو أحد أشهر منصات التواصل الاجتماعي في العالم. علاوة على ذلك ، فإنه يوفر كمية كبيرة من البيانات التي يستخدمها الباحثون في مختلف المجالات حول العالم. لذلك ، في هذه الأطروحة ، نصف مجموعة البيانات الأولى والتي تحتوى على التغريدات العربية حول كوفيد ١٩ التي جمعناها منذ 1 يناير 2020. ستساعد مجموعة البيانات الباحثين وصناع السياسات على دراسة القضايا المجتمعية المختلفة المتعلقة بالوباء. نظرًا لأهمية احتواء المعلومات المضللة على تويتر باللغة العربية و الحد من انتشارها ، تصف هذه الدراسة منهجية للكشف التلقائي عن المعلومات الخاطئة للصحة باللغة العربية على تويتر ، بدءًا من تقديم مجموعة بيانات المعلومات المضللة باللغة العربية عن كوفيد ١٩. لقد بنينا مجموعة البيانات على خطوتين ؛ استخراج العينات و تسمية البيانات. نظرًا لأنه من الضروري تحقيق نتائج جيدة للكشف عن التغريدات المضللة من التغريدات الأخرى ، فإننا نتحرى فعالية التعلم الآلي ومصنفات التعلم العميق بميزات مختلفة ، بما في ذلك تضمين الكلمات وتكرار الكلمات. تظهر التجارب أن مصنّفات التعلم الآلي تفوقت في أدائها على مصنفات التعلم العميق ، كما أن تحسين المنطقة الواقعة تحت المنحنى (AUC) يحسن أداء النموذج. علاوة على ذلك ، يمكن للأشخاص المؤثرين الذين يساهمون في نشر المعلومات بين العديد من المستخدمين أن يكونوا استراتيجية فعالة لزيادة الوعي العام ، والحد من انتشار المعلومات المضللة وتعزيز الصحة العامة. لتحقيق هذا الهدف ، تُنشئ الدراسة المقدمة شبكة من سلوكيات المستخدمين لتحديد المؤثرين خلال شهر مارس 2020. ونطبق العديد من تقنيات التصنيف ، بما في ذلك مقاييس المركزية ، و HITS ، و PageRank ، VoteRank ، ومقياس التأثير المترابط الموزون (WCI)لقياس تأثير مستخدمي تويتر ومقارنة ترتيب المستخدمين. تظهر النتائج أن معظم الحسابات المؤثرة في تويتر كانت حسابات إخبارية وحكومية.