מוחי הקודח אולי מצא פתרון לפורום הישן

המקום להעלאת שאלות, תהיות ובעיות של הגולשים, הקשורות לאתר ולפורומים. זהו הפורום היחיד בו גם אורחים שאינם רשומים לאתר יכולים לכתוב.

מוחי הקודח אולי מצא פתרון לפורום הישן

הודעהעל ידי מנהל האתר » 17 אפריל 2013, 16:52

אני לא מפסיק לחשוב על כמות ההודעות (והמשתמשים) שאיבדנו בפורום הקודם.
אשר על כן, אני לא מפסיק לחשוב על אפשרויות.
היום אני חושב שמצאתי פתרון. סזיפי משהו, אבל נדמה לי שהוא אפשרי.
====[תחילת תיאור טכני למעוניינים]====
אז ככה. כל הפורום בפרט והאתר בכלל מנוהל באמצעות בסיס מידע המכיל עשרות טבלאות. מתוכן 2 טבלאות עיקריות המכילות נתוני הודעות.
הבעיה היא שההודעות מופיעות בקידוד לא נכון, זאת בגלל שכשאשר הקמתי את האתר לא היה פתרון לעברית (זוכרים שעוד עבדו עם עברית לוגית ועברית ויזאולית וכאלה?) ולכן מאז ועד היום כל המידע שנשמר, נשמר בצורה שגויה ובעצם המידע אינו קריא ישירות ממסד הנתונים, ולכן אני לא יכול לשלוף אותו ולהעביר אותו.
למשל, "דתי ברשת", נכתב כך: ãúé áøùú
כל הכלים שניסיתי בשביל להמיר את מסד הנתונים (והוא ענק!!!) לא צלחו.
אבל היום נפל לי האסימון. כל מה שאני צריך לעשות זה להמיר את האותיות אחת אחת מג'יבריש לעברית. לכן יצרתי טבלה כזו:
à א
á ב
â ג
ã ד
ä ה
å ו
æ ז
ç ח
è ט
é י
ë כ
ê ך
ì ל
î מ
í ם
ð נ
ï ן
ñ ס
ò ע
ô פ
ó ף
ö צ
õ ץ
÷ ק
ø ר
ù ש
ú ת
ובאמצעות עורך שיודע לעבוד עם קבצים גדולים (רק טבלת ההודעות לבדה עולה על 170 מ"ב בקובץ אחד!) אני מתחיל כרגע להמיר אות אות. כלומר, זה לא שאני עובר על כל האותיות בעצמי ומחליף, אלא אומר לאורך להמיר את האות à באות א', את á באות ב', וכו'...
עכשיו. כל זה לא מספיק. היות ובסיס הנתונים החדש אינו מתאים לבסיס הנתונים הישן. כלומר, טבלת ההודעות אינה כוללת את אותן ערכים. נתחיל בזה שבפורום החדש יש טבלה אחת ובפורום הישן יש 2 טבלאות עם קישורים ביניהן. זה אומר שאני אצטרך עדיין לוודא שאני מעביר את הנתונים מהפורום הישן בהתאם למבנה החדש. לא נגעתי בזה עדיין. האמת, אני חושש, כי זה לא פשוט בכלל.
אחת הסיבות שזה לא פשוט היא, שהטבלה הישנה כולל קישור לטבלת המשתמשים, כך שכל הודעה לא נושאת את שם המשתמש אלא קישור למשתמש בטבלת המשתמשים. התחלתם להבין את הבלגן שנוצר עכשיו? הרי שנגיד ש-495 הוא מספר 2 בטבלת המשתמשים בפורום החדש, אבל בפורום הישן הוא היה מס' 176 (סתם דוגמא), הרי שיש לנו 2 בעיות:
1. זה אומר שאני חייב לייבא גם את טבלת המשתמשים בכדי שהודעות הפורום יראו משתמשים קיימים ולא משתמשי רפאים.
2. זה אומר שאני צריך לעבוד על המשתמשים בפורום הנוכחי ולהתאים אותם לפורום הישן. זה גם אומר המרה לעברית (כמו לעיל) של בסיס נתוני המשתמשים. וזה גם אומר שכולם יחזרו בעצם לשם המשתמש (והססמא) הישן שלהם (שזה דווקא טוב).
====[סיום תיאור טכני למעוניינים]====
בקיצור, אני מניח שעוד חזון למועד. אם היה לי זמן אני מניח שביומיים-שלושה עבודה אינטנסיבית הייתי מסיים את זה. אבל... אתם יודעים איך זה.
מצד שני, אני בהחלט רואה את האופק באור חיובי ואני מאמין שזה יצליח. רק צריך להתפלל שאני לא אדפוק את מסדי הנתונים בזמן הנסיונות. בגלל זה אני עובד על בסיס מידע זמני לנסיונות. אחרי שהכל ייראה טוב, אוכל בעצם להפוך את בסיס הנתונים הנסיוני לבסיס הנתונים הקבוע.

בקיצור, תתפללו עלי! :)
"יש בעולם שלושה סוגים של אנשים: כאלה שיודעים לספור וכאלה שלא"
סמל אישי של המשתמש
מנהל האתר
מנהל האתר
 
הודעות: 229
הצטרף: 21 מרץ 2013, 17:54
מיקום: נתניה

Re: מוחך הקודח מצא פתרון לפורום הישן!

הודעהעל ידי כוכב-דוד » 17 אפריל 2013, 17:22

יפה מאוד, ובהצלחה בהמשך הקידוחים!

אני לא מתמצא בתיכנות, אני מבין רק את הרעיונות הכלליים. ובערך לכיווּן כזה התכוונתי כשאמרתי שאם התצוגה יודעת להבחין בכל גופן חייבת להיות גם דרך ואלגוריתם לתוכנה שתוכל להמיר את המקור לכל פורמט אחר.
לגבי הסיפא אודות תיאום בין רשימת המשתמשים הישנה לחדשה. אם זו תיוותר הבעיה היחידה, כבר לא עדיף יהיה לאתחל את הפורום החדש באופן אחר? או לחליפין לחזור לפורום הישן לאחר שעבר מתיחת פָּנִים וירטואלית ומתיחת פְּנִים דיגיטלית?
הַדְרִיכֵנִי בַאֲמִתֶּךָ וְלַמְּדֵנִי, כִּי אַתָּה אֱלֹהֵי יִשְׁעִי אוֹתְךָ קִוִּיתִי כָּל הַיּוֹם (תהלים כה, ה).
סמל אישי של המשתמש
כוכב-דוד
 
הודעות: 811
הצטרף: 07 אפריל 2013, 00:29
מיקום: ירושלים

Re: מוחי הקודח אולי מצא פתרון לפורום הישן

הודעהעל ידי מנהל האתר » 17 אפריל 2013, 17:52

כוכב, אני לא חושב שכדאי לחזור חזרה לפורום הישן.
א. אני לא יכול לתקן אותו מבחינת העברית. הוא עובד בקידוד אחר, כזכור.
ב. הפורום הנוכחי מתקדם בהרבה מבחינה טכנולוגית. שלא לדבר על נוחות הניהול.
ג. הפורום הנוכחי עדיין קטן ואני מניח שלא תהיה לי בעיה לעשות את התיאומים הנדרשים. בנתיים יש כאן רק 12 משתמשים רשומים. גם אם אצטרך להתאים אותם למבנה הישן ידנית, זה לא יהיה קשה כל כך.
"יש בעולם שלושה סוגים של אנשים: כאלה שיודעים לספור וכאלה שלא"
סמל אישי של המשתמש
מנהל האתר
מנהל האתר
 
הודעות: 229
הצטרף: 21 מרץ 2013, 17:54
מיקום: נתניה

Re: מוחי הקודח אולי מצא פתרון לפורום הישן

הודעהעל ידי מנהל האתר » 17 אפריל 2013, 17:55

רק רציתי לשתף אתכם בשינויים. הנה למשל השינויים שנעשו עבור האות ו'.
מדובר על מעל 88 מליון (!) המרות. כל המרת אות כזו לוקחת בערך רבע שעה עד עשרים דקות לעיבוד המחשב.
תמונה
"יש בעולם שלושה סוגים של אנשים: כאלה שיודעים לספור וכאלה שלא"
סמל אישי של המשתמש
מנהל האתר
מנהל האתר
 
הודעות: 229
הצטרף: 21 מרץ 2013, 17:54
מיקום: נתניה

Re: מוחי הקודח אולי מצא פתרון לפורום הישן

הודעהעל ידי כוכב-דוד » 18 אפריל 2013, 02:47

אני מניח שבצד כל נסיונות השינויים שאתה עושה בפורום היישן אתה משאיר בצד עותק מהמקור, כך שאם ייהרס משהו יש תמיד גיבוי.
הַדְרִיכֵנִי בַאֲמִתֶּךָ וְלַמְּדֵנִי, כִּי אַתָּה אֱלֹהֵי יִשְׁעִי אוֹתְךָ קִוִּיתִי כָּל הַיּוֹם (תהלים כה, ה).
סמל אישי של המשתמש
כוכב-דוד
 
הודעות: 811
הצטרף: 07 אפריל 2013, 00:29
מיקום: ירושלים

Re: מוחי הקודח אולי מצא פתרון לפורום הישן

הודעהעל ידי מנהל האתר » 18 אפריל 2013, 19:27

זהו, התייאשתי.
אחרי שתרגמתי את כל התוים הג'יברישיים לעברית (ואני לא מזכיר את מס' הפעמים שהעורך קרס והייתי צריך להתחיל הכל מהתחלה כי לא שמרתי), עשיתי בדיקת איכות קצרה.
עד מהרה התברר לי לחרדתי שהתרגום אינו נכון! מסתבר שסימני הניקוד העבריים גם הם מקודדים איכשהו בג'יבריש, והמרת הקובץ לעברית - המיר את סימני הניקוד לאותיות עבריות רגילות (כנראה יש צירוף של אותיות ג'יבריש שמהווה אות עם ניקוד).
אז זה אומר שעכשיו אני צריך טבלה של כל האותיות בצורתן הרגילה וטבלה לכל סימן ניקוד נוסף (אחת לקמץ, אחת לפתח, סגול, צירה וכו')... בקיצור. אני צריך מס' טבלאות כמספר סימני הניקוד שיש ועוד הטבלה לעיל, ללא ניקוד.
בקיצור, אני לא הולך לעשות את זה. זה מטורף.
מה גם, שהסתכלתי על מבני הטבלאות של הפורומים. הם שונים לחלוטין. ממש לגמרי. יקח לי המון זמן להבין איזה שדה אני צריך לקחת מאיזה טבלה בשביל להגיע למבנה הטבלה של הפורום החדש.
אז סורי. אני לא חושב שאני יכול לעשות את זה. נצטרך לשמור את האתר הקודם כגיבוי לקריאה בלבד ולחדש חידושים פה.
"יש בעולם שלושה סוגים של אנשים: כאלה שיודעים לספור וכאלה שלא"
סמל אישי של המשתמש
מנהל האתר
מנהל האתר
 
הודעות: 229
הצטרף: 21 מרץ 2013, 17:54
מיקום: נתניה

Re: מוחי הקודח אולי מצא פתרון לפורום הישן

הודעהעל ידי כוכב-דוד » 18 אפריל 2013, 21:32

אני חושב שזה לא מדוייק.
סימני הניקוד הם סימנים נוספים בצד האות - בשפת Unicode.
http://he.wikipedia.org/wiki/%D7%99%D7% ... 7%95%D7%93
http://yeda.cs.technion.ac.il/~yona/tal ... /U0590.pdf
http://www.pixiesoft.com/flip/
הַדְרִיכֵנִי בַאֲמִתֶּךָ וְלַמְּדֵנִי, כִּי אַתָּה אֱלֹהֵי יִשְׁעִי אוֹתְךָ קִוִּיתִי כָּל הַיּוֹם (תהלים כה, ה).
סמל אישי של המשתמש
כוכב-דוד
 
הודעות: 811
הצטרף: 07 אפריל 2013, 00:29
מיקום: ירושלים

Re: מוחי הקודח אולי מצא פתרון לפורום הישן

הודעהעל ידי מנהל האתר » 22 אפריל 2013, 14:54

בפועל, זה מה שקרה.
לא משנה. אין לי כבר כוח להתעסק עם זה. יצאו לי העיניים ובסוף לא קיבלתי את התוצאה לה ציפיתי.
"יש בעולם שלושה סוגים של אנשים: כאלה שיודעים לספור וכאלה שלא"
סמל אישי של המשתמש
מנהל האתר
מנהל האתר
 
הודעות: 229
הצטרף: 21 מרץ 2013, 17:54
מיקום: נתניה


חזור אל משוב

מי מחובר

משתמשים הגולשים בפורום זה: אין משתמשים רשומים ו 0 אורחים

cron