تكنولوجيا التعرف على اللغة تفشل أمام أسماء شخصيات “Game of Thrones”

تكافح تكنولوجيا التعرف على اللغة مع الأسماء الغريبة في مسلسل “Game of thrones”، التي لا تمثل كلمات طبيعية بالنسبة لها.
وشخصيات “Game of Thrones” والعديد من روايات الخيال الأخرى تشكل مشكلة تتعلق بالتكنولوجيا المصممة لفك رموز اللغات والكلمة المكتوبة، فهي لا تشبه معظم الأسماء من العالم الواقعي وغالبًا ما لا تلتقطها التكنولوجيا.
وتم تطوير الخوارزميات وتدريبها على اكتشاف الأسماء من خلال دراسة مقالات الصحف، ولكن يوجد أسلوب كتابة مختلف تمامًا في الروايات والذى يجعل اكتشاف الأسماء الخيالية أمرًا مستحيلًا تقريبًا.
واختبر الباحثون قدرة 4 أدوات مختلفة من أدوات معالجة اللغة الطبيعية (NLP) على التعرف الى أسماء الشخصيات الشهيرة في 40 رواية، بما في ذلك “Game of thrones”، حيث تستخدم أدوات معالجة اللغة الطبيعية (NLP) بشكل شائع في العديد من التطبيقات اليومية مثل “سيري” و”غوغل”، ومع ذلك، فإن التكنولوجيا غير مكتملة وتفشل عندما تواجه أسماء غريبة.