Tag Archives: csv

แผนที่กินดีจังหวัดลำปาง แบบ csv ฟรี

แผนที่กินดีจังหวัดลำปาง ได้ถูกแปลงเป็นแฟ้มประเภท CSV ทั้งแบบ ansi และ utf8 เปิดให้นักพัฒนาได้ดาวน์โหลดแล้ว มีที่มาจากการที่ผมเป็นนักเที่ยว ไปเดินเที่ยวห้างเซ็นทรัล แล้วพบว่า มีการเผยแพร่อีบุ๊คเล่มนี้ ในงาน Lampang proud เมื่อสแกนคิวอาร์โค้ดจาก monitor ที่ตั้งโชว์ พบเอกสารแบบ PDF ซึ่งเป็นเอกสารเผยแพร่ให้ดาวน์โหลด ที่มีข้อมูลแนะนำร้านอาหารกินดีในจังหวัดลำปางในรูปเล่มที่สวยงาม คือ น่าไปกิน น่าไปเที่ยว น่าไปทาน น่าอร่อย จำนวน 199 ร้าน ที่เป็นฐานข้อมูลแบบยินดีเผยแพร่ จัดทำโดย เครือข่ายผู้จัดการนวัตกรรม เมื่อแปลงจาก PDF เป็นข้อความ พบข้อมูลที่น่าสนใจหลายหัวข้อ  จึงนำข้อมูลบางส่วน ได้แก่ ชื่อกลุ่ม ชื่อร้าน แนะนำร้าน เมนูแนะนำ และลิงก์ภาพอีบุ๊คแต่ละร้าน มาจัดทำแฟ้มข้อมูลแบบ CSV (ที่คิดว่าจะปรับแก้ต่อเนื่อง) เพื่อให้นักพัฒนานำแฟ้มไปต่อยอด พัฒนาแอปพลิเคชันทั้งบนเว็บ หรือบนแอป ให้บริการข้อมูลแก่นักกิน นักเที่ยว อินฟลูเอนเซอร์ ได้เข้ามาสืบค้นสารสนเทศต่อไป

ท่านใดมีข้อเสนอแนะ เช่น เพิ่มร้านใหม่ แก้ไขข้อมูลแนะนำร้าน ปรับปรุงระบบ แจ้งลิงก์แผนที่ร้าน เพื่อใช้ปรับปรุงข้อมูลในฐานข้อมูล version ที่ได้นำมาต่อยอดนี้ สามารถแจ้งเข้ามาได้ครับ เพื่อเป็นอีกแหล่งข้อมูลหนึ่งที่ต่อยอด และสนับสนุนการบรรลุวัตถุประสงค์ของเครือข่ายผู้จัดทำ แผนที่กินดีจังหวัดลำปาง ต่อไป

นึกย้อนไปในอดีต น้องที่ทะเบียนทำการรับ-ส่งแฟ้ม csv กับหน่วยเหนือ จำนวน 3 ฐาน แล้วต้องการเปิดบาง sheet ขึ้นมาอ่าน แต่แฟ้มในปัจจุบันมักมีการเข้ารหัสเป็น utf8 ไว้ เมื่อเปิดแล้วก็จะอ่านไม่ออก ปรากฎเป็นตัวยึกยือ เพราะไม่มี header แบบแฟ้มทั่วไป ต้อง encode ใหม่เป็นแบบที่โปรแกรมรองรับ คือ ansi เมื่อนึกถึงปัญหานี้ จึงเปลี่ยนการเข้ารหัสแฟ้มข้อมูลกินดีแบบ csv เป็น ansi  เมื่อนำไปเปิดบน sheet ยอดนิยม ก็จะเห็นภาษาไทยปรากฎอย่างถูกต้อง แต่ถ้าบันทึกเป็น utf8 ผู้ใช้ก็อาจต้องไป encode กันอีกครั้งก่อนเปิด

http://www.thaiabc.com/restaurant/lampangkindee_ansi.csv

ข้อมูลเปิด (Open Data) พบว่า ลำปางมี 97 ตำบล พร้อมตำแหน่ง latitude,longitude

tambon sala

tambon sala

เนื่องจากสนใจข้อมูลของลำปางเป็นพิเศษ จึงเข้าเว็บไซต์ data.go.th พบว่า #TopOpenData
คือ ข้อมูลพิกัด LAT/LONG ที่ตั้งตำบล ใน วันที่ 25 กันยายน 2560 พบมีคนเข้าชม จำนวนการเข้าชม 46423 ครั้ง เป็นข้อมูลขอบเขตการปกครอง ของ กรมการปกครอง ได้แฟ้มพิกัดตำบลของทั้งประเทศ
จำนวน 7768 รายการ

1. ข้อมูลจาก data.go.th มาในแฟ้มชื่อ tambon.xlsx
Link : 
https://data.go.th/DatasetDetail.aspx?id=c6d42e1b-3219-47e1-b6b7-dfe914f27910

2. แล้วแปลงเป็น csv แต่เรียงตามรหัสตำบลเก็บในแฟ้ม tambon.csv

3. เลือกเฉพาะลำปางได้ 97 ตำบล เก็บใน tambon_lampang.csv

4. นับจาก tambon.xlsx ด้วย pivot table ในลำปางมี 97 ตำบล

5. สรุปว่ายืนยันข้อมูลว่าตรงกับรายการข้อมูลที่มีจริงใน tambon_lampang.csv

6. เมื่อตรวจตำแหน่งของ ต.ศาลา อ.เกาะคา จ.ลำปาง
พบว่า latitude และ longitude ไปตกกลางทุ่งนา 
อยู่หลังศูนย์แสดงสินค้าเซรามิกและหัตถอุตสาหกรรม จังหวัดลำปาง
ห่างทางหลวงไปหลายร้อยเมตร

แฟ้มทั้งหมดเก็บไว้ที่ https://github.com/thaiall/lampang
เพื่อเป็น open data สำหรับ developer ต่อไป

 

วิธีอ่านตัวอักษรภาษาไทย
ข้อมูลที่เป็นแฟ้ม .csv เหล่านั้น ได้มาจากการ export มาจาก excel
ข้อมูลเป็น ANSI (TIS620) ไม่ใช่ UTF8  จึงอ่านใน github.com ไม่เป็นภาษาไทย

หากจะเปิดมาแก้ไข ทำได้ดังนี้
1. Chrome
click raw แล้ว save as จาก browser
ไปสร้างเป็น file แล้วเปิดด้วย notepad ก็จะอ่านภาษาไทยได้ปกติ
2. Firefox
click raw แต่เห็นภาษาไทยที่อ่านไม่ออกก็ต้องเปลี่ยน encoding
มุมบนขวามี 3 bar เมื่อคลิ๊กแล้วเลือก customize พบ icon : Text Encoding
ลากมาไว้ในหน้าต่าง เครื่องมือ ด้านขวา
ในหน้า raw ให้คลิ๊กเลือก Thai จาก Text Encoding
3. Clone repository
เนื่องจากมีหลายแฟ้ม ถ้า clone ออกมาทั้ง repository
จาก https://github.com/thaiall/lampang
จะได้ทุกแฟ้ม และเปิดผ่าน editor ในเครื่อง
ก็จะง่ายกว่า copy แยกแฟ้ม ตามที่แนะนำไว้ข้างต้น

ภาษาไทย tambon github

ภาษาไทย tambon github