Tag: SQL

dbplyr: แนะนำ package และ 6 ขั้นตอนในการทำงานกับ database ด้วย dplyr syntax ในภาษา R — ตัวอย่างการทำงานกับ Chinook database
ในบทความนี้ เราจะไปดูวิธีใช้ dbplyr ซึ่งเป็น package สำหรับทำงานกับ database ในภาษา R และเหมาะกับคนที่ต้องการทำงานโดยใช้ภาษา R เป็นหลักกัน

ถ้าพร้อมแล้ว ไปเริ่มกันเลย
🤔 What Is dbplyr?

dbplyr เป็น package ในภาษา R สำหรับทำงานกับ database โดยใช้ dplyr syntax แทน SQL เช่น แทนที่เราเขียน:
```
SELECT * FROM table
```
เราสามารถใช้ dplyr syntax ได้แบบนี้:
```
select(table, everything())
```
(Note: อ่านวิธีใช้ dplyr ได้ที่นี่)

🏁 Getting Started

เราสามารถเริ่มใช้งาน dbplyr ได้โดยติดตั้งและโหลด 4 packages ดังนี้:
1. DBI: สำหรับเชื่อมต่อกับ database (อ่านวิธีใช้เพิ่มเติมได้ที่นี่)
2. RSQLite: สำหรับเชื่อมต่อกับ SQLite database (เราจะเปลี่ยน package นี้ตาม database ที่เราใช้ เช่น RPostgres สำหรับ Postgres database)
3. dplyr: สำหรับ dplyr syntax เช่น select(), filter(), arrange()
4. dbplyr: สำหรับทำงานกับ database ด้วย dplyr syntax
```
# Install packages
install.packages("DBI")
install.packages("RSQLite")
install.packages("dplyr")
install.packages("dbplyr")

# Load packages
library(DBI)
library(RSQLite)
library(dplyr)
library(dbplyr)
```
🏃‍♂️‍➡️ Using dbplyr

เราสามารถใช้ dbplyr เพื่อทำงานกับ database ได้ใน 6 ขั้นตอน:
1. Connect to the database
2. Create a lazy tibble
3. Create a query
4. Show the query
5. Get the result
.

1️⃣ Connect to the Database

ในขั้นแรก เราจะเชื่อมต่อกับ local database ด้วย DBI::dbConnect และ RSQLite::SQLite():
```
# Connect to database
con <- dbConnect(RSQLite::SQLite(),
                 "chinook.sqlite")
```
Note: โหลด “chinook.sqlite” ได้จาก GitHub

.

2️⃣ Create a Lazy Tibble

ในขั้นที่ 2 เราจะสร้าง lazy tibble หรือ object ที่ใช้แทน database table ซึ่งทำได้ใน 2 steps:

Step 1. ดูรายชื่อ table ทั้งหมด ใน database ด้วย DBI::dbListTables():
```
# View all tables
dbListTables(con)
```
ผลลัพธ์:
```
 [1] "Album"         "Artist"        "Customer"      "Employee"     
 [5] "Genre"         "Invoice"       "InvoiceLine"   "MediaType"    
 [9] "Playlist"      "PlaylistTrack" "Track" 
```
Step 2. สร้าง lazy tibble จากชื่อ table ที่ต้องการ ด้วย dplyr::tbl():
```
# Create lazy tibble
tracks <- tbl(con,
              "Track")

# View tibble
tracks
```
ผลลัพธ์:
```
# Source:   table<`Track`> [?? x 9]
# Database: sqlite 3.50.1 [C:\\My Code\\RStudio\\chinook.sqlite]
   TrackId Name           AlbumId MediaTypeId GenreId Composer Milliseconds  Bytes UnitPrice
     <int> <chr>            <int>       <int>   <int> <chr>           <int>  <int>     <dbl>
 1       1 For Those Abo…       1           1       1 Angus Y…       343719 1.12e7      0.99
 2       2 Balls to the …       2           2       1 NA             342562 5.51e6      0.99
 3       3 Fast As a Sha…       3           2       1 F. Balt…       230619 3.99e6      0.99
 4       4 Restless and …       3           2       1 F. Balt…       252051 4.33e6      0.99
 5       5 Princess of t…       3           2       1 Deaffy …       375418 6.29e6      0.99
 6       6 Put The Finge…       1           1       1 Angus Y…       205662 6.71e6      0.99
 7       7 Let's Get It …       1           1       1 Angus Y…       233926 7.64e6      0.99
 8       8 Inject The Ve…       1           1       1 Angus Y…       210834 6.85e6      0.99
 9       9 Snowballed           1           1       1 Angus Y…       203102 6.60e6      0.99
10      10 Evil Walks           1           1       1 Angus Y…       263497 8.61e6      0.99
# ℹ more rows
# ℹ Use `print(n = ...)` to see more rows
```
.

3️⃣ Create a Query

ในขั้นที่ 3 เราจะเขียน dplyr syntax เพื่อ query table ที่ต้องการ

เช่น สรุปข้อมูลจำนวนเพลง ค่าเฉลี่ยความยาวเพลง (Milliseconds) และขนาดเพลง (Bytes) ของแต่ละ album:
```
# Create query
album_info <- tracks |>
  
  # Group by album
  group_by(AlbumId) |>
  
  # Summarise
  summarise(
    
    # Number of tracks
    tracks = n(),
    
    # Average duration
    mean_millisec = mean(Milliseconds,
                         na.rm = TRUE),
    
    # Total size
    total_bytes = sum(Bytes)
  ) |>
  
  # Sort by duration
  arrange(desc(mean_millisec))
```
ตอนนี้ code ของเราจะยังไม่ถูกส่งไปยัง database เพราะ lazy tibble จะเก็บคำสั่งไว้จนกว่าเราจะมีคำสั่งให้ส่ง

เราไปดูคำสั่งที่เราสามารถใช้กับ code ที่ยังไม่ถูกส่งไปกัน

.

4️⃣ Show the Query

เราสามารถใช้ dbplyr::show_query() เพื่อดู SQL ที่จะถูกส่งไปยัง database (ซึ่งแปลงมาจาก dplyr syntax ของเรา) ได้:
```
# Show query
show_query(album_info)
```
ผลลัพธ์:
```
<SQL>
SELECT
  `AlbumId`,
  COUNT(*) AS `tracks`,
  AVG(`Milliseconds`) AS `mean_millisec`,
  SUM(`Bytes`) AS `total_bytes`
FROM `Track`
GROUP BY `AlbumId`
ORDER BY `mean_millisec` DESC
```
.

5️⃣ Collect the Result

เราสามารถส่ง code เพื่อไป query database ได้ด้วย dbplyr::collect():
```
# Get result
album_info_tb <- collect(album_info)

# View the result
album_info_tb
```
ผลลัพธ์:
```
# A tibble: 347 × 4
   AlbumId tracks mean_millisec total_bytes
     <int>  <int>         <dbl>     <int64>
 1     253     24      2925574. 12872621850
 2     227     19      2778265. 10059916535
 3     229     26      2717907  13917603291
 4     231     24      2637068. 12344960921
 5     226      1      2622250    490750393
 6     228     23      2599142. 11781321607
 7     230     25      2594197.  5280909854
 8     254      1      2484567    492670102
 9     261     17      2321673.  7708725642
10     251     25      1532684.  7652731262
# ℹ 337 more rows
# ℹ Use `print(n = ...)` to see more rows
```
.

6️⃣ Disconnect the Database

สุดท้าย เมื่อเราทำงานเสร็จแล้ว เราจะปิดการเชื่อมต่อกับ database ด้วย DBI::dbDisconnect():
```
# Disconnect from database
dbDisconnect(con)
```
เป็นการจบ loop การทำงานกับ database ด้วย dbplyr

💪 Summary

ในบทความนี้ เราได้ไปทำความรู้จัก 6 ขั้นตอนในการใช้ dbplyr เพื่อทำงานกับ database ในภาษา R กัน:
1. Connect to the database: DBI::dbConnect() และ RSQLite::SQLite()
2. Create a lazy tibble: dplyr::tbl()
3. Create a query: ใช้ dplyr syntax คู่กับ lazy tibble
4. Show the query: dbplyr::show_query()
5. Collect the result: dbplyr::collect()
6. Disconnect the database: DBI::dbDisconnect()
😺 GitHub

ดูตัวอย่าง code และ database ในบทความนี้ได้ที่ GitHub

📃 References
✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

📕 ขอฝากหนังสือเล่มแรกในชีวิตด้วยนะครับ 😆

🙋 ใครที่กำลังเรียนจิตวิทยาหรือทำงานสายจิตวิทยา และเบื่อที่ต้องใช้ software ราคาแพงอย่าง SPSS และ Excel เพื่อทำข้อมูล

💪 ผมขอแนะนำ R Book for Psychologists หนังสือสอนใช้ภาษา R เพื่อการวิเคราะห์ข้อมูลทางจิตวิทยา ที่เขียนมาเพื่อนักจิตวิทยาที่ไม่เคยมีประสบการณ์เขียน code มาก่อน

ในหนังสือ เราจะปูพื้นฐานภาษา R และพาไปดูวิธีวิเคราะห์สถิติที่ใช้บ่อยกัน เช่น:
- Correlation
- t-tests
- ANOVA
- Reliability
- Factor analysis
🚀 เมื่ออ่านและทำตามตัวอย่างใน R Book for Psychologists ทุกคนจะไม่ต้องพึง SPSS และ Excel ในการทำงานอีกต่อไป และสามารถวิเคราะห์ข้อมูลด้วยตัวเองได้ด้วยความมั่นใจ

แล้วทุกคนจะแปลกใจว่า ทำไมภาษา R ง่ายขนาดนี้ 🙂‍↕️

👉 สนใจดูรายละเอียดหนังสือได้ที่ meb:

ดูรายละเอียดหนังสือ R Book for Psychologists
Share this:
X
Facebook
Like Loading…
2025-10-09

DBI: แนะนำ 4 ขั้นตอนในการเชื่อมต่อและ query ข้อมูลจาก database โดยใช้ภาษา R — ตัวอย่างการทำงานกับ Chinook database

ในบทความนี้ เราจะมาดู 4 ขั้นตอนในการเชื่อมต่อและทำงานกับ database ในภาษา R ด้วย DBI package กัน:

Get started
Explore the database
Query the database
Close the connection

ถ้าพร้อมแล้ว ไปเริ่มกันเลย

💻 Step 1. Get Started

📦 DBI Package

DBI (Database Interface) เป็น package สำหรับเชื่อมต่อกับ database ซึ่งทำให้เราทำงานกับ database ในภาษา R ได้โดยตรง

ในบทความนี้ เรามาลองดูการใช้งาน DBI ผ่านการทำงานกับ Chinook SQLite database กัน (เราสามารถโหลด Chinook เพื่อลองทำตามได้จาก GitHub)

⬇️ Install & Connect

ในขั้นแรกของการใช้งาน เราจะติดตั้งและโหลด DBI พร้อมกับ package สำหรับ database ที่เราจะทำงานด้วย

อย่างในกรณีนี้ เราจะติดตั้งและโหลด RSQLite package เพราะเราจะทำงานกับ SQLite database

Note: ถ้าเราทำงานกับ database อื่น เราจะต้องติดตั้งและโหลด package อื่น เช่น:

MySQL → RMySQL
PostgresSQL → RPostgresSQL
Oracle → ROracle

ติดตั้ง packages:

# Install
install.packages("DBI")
install.packages("RSQLite")

โหลด packages:

# Load
library(DBI)
library(RSQLite)

หลังติดตั้งและโหลด packages แล้ว เราจะเชื่อมต่อกับ database ด้วย dbConnect() แบบนี้:

# Connect to database
con <- dbConnect(RSQLite::SQLite(),
                 "chinook.sqlite")

Note: ในกรณีที่ database ไม่ได้อยู่ใน working directory เราจะต้องใช้ absolute file path แทนชื่อไฟล์ เช่น:

# Connect to database
con <- dbConnect(RSQLite::SQLite(),
                 "C:/Users/YourUser/Documents/R_Projects/my_data/chinook.sqlite")

เท่านี้ เราก็พร้อมที่จะทำงานกับ database กันแล้ว

👀 Step 2. Explore the Database

เริ่มแรก เราจะสำรวจ database เพื่อทำความเข้าใจโครงสร้างข้อมูลกันก่อน

เรามี 2 functions ที่ช่วยเราได้ ได้แก่:

dbListTables(): ดูรายชื่อ tables ทั้งหมดใน database
dbGetQuety(): ดู columns ใน table ที่ต้องการ

1️⃣ dbListTable()

ตัวอย่าง:

# List tables in the database
dbListTables(con)

ผลลัพธ์:

 [1] "Album"         "Artist"        "Customer"      "Employee"     
 [5] "Genre"         "Invoice"       "InvoiceLine"   "MediaType"    
 [9] "Playlist"      "PlaylistTrack" "Track"

2️⃣ dbGetQuery()

ตัวอย่าง:

# List columns in a table
dbGetQuery(con,
           "PRAGMA table_info(Artist)")

ผลลัพธ์:

  cid     name          type notnull dflt_value pk
1   0 ArtistId       INTEGER       1         NA  1
2   1     Name NVARCHAR(120)       0         NA  0

ในกรณีที่เราต้องการดู columns ในทุก table เราสามารถใช้ for loop ช่วยได้แบบนี้:

# Get the table list
tables <- dbListTables(con)

# Get all columns
for (table_name in tables) {
  
  # Print the table name
  message(paste0("\\n👉 Table: ", table_name))
  
  # Get the columns
  column_info <- dbGetQuery(con,
                            paste0("PRAGMA table_info(",
                                   table_name, 
                                   ")"))
  
  # Print the columns
  print(column_info)
}

ผลลัพธ์:

👉 Table: Album
  cid     name          type notnull dflt_value pk
1   0  AlbumId       INTEGER       1         NA  1
2   1    Title NVARCHAR(160)       1         NA  0
3   2 ArtistId       INTEGER       1         NA  0
👉 Table: Artist
  cid     name          type notnull dflt_value pk
1   0 ArtistId       INTEGER       1         NA  1
2   1     Name NVARCHAR(120)       0         NA  0
👉 Table: Customer
   cid         name         type notnull dflt_value pk
1    0   CustomerId      INTEGER       1         NA  1
2    1    FirstName NVARCHAR(40)       1         NA  0
3    2     LastName NVARCHAR(20)       1         NA  0
4    3      Company NVARCHAR(80)       0         NA  0
5    4      Address NVARCHAR(70)       0         NA  0
6    5         City NVARCHAR(40)       0         NA  0
7    6        State NVARCHAR(40)       0         NA  0
8    7      Country NVARCHAR(40)       0         NA  0
9    8   PostalCode NVARCHAR(10)       0         NA  0
10   9        Phone NVARCHAR(24)       0         NA  0
11  10          Fax NVARCHAR(24)       0         NA  0
12  11        Email NVARCHAR(60)       1         NA  0
13  12 SupportRepId      INTEGER       0         NA  0
👉 Table: Employee
   cid       name         type notnull dflt_value pk
1    0 EmployeeId      INTEGER       1         NA  1
2    1   LastName NVARCHAR(20)       1         NA  0
3    2  FirstName NVARCHAR(20)       1         NA  0
4    3      Title NVARCHAR(30)       0         NA  0
5    4  ReportsTo      INTEGER       0         NA  0
6    5  BirthDate     DATETIME       0         NA  0
7    6   HireDate     DATETIME       0         NA  0
8    7    Address NVARCHAR(70)       0         NA  0
9    8       City NVARCHAR(40)       0         NA  0
10   9      State NVARCHAR(40)       0         NA  0
11  10    Country NVARCHAR(40)       0         NA  0
12  11 PostalCode NVARCHAR(10)       0         NA  0
13  12      Phone NVARCHAR(24)       0         NA  0
14  13        Fax NVARCHAR(24)       0         NA  0
15  14      Email NVARCHAR(60)       0         NA  0
👉 Table: Genre
  cid    name          type notnull dflt_value pk
1   0 GenreId       INTEGER       1         NA  1
2   1    Name NVARCHAR(120)       0         NA  0
👉 Table: Invoice
  cid              name          type notnull dflt_value pk
1   0         InvoiceId       INTEGER       1         NA  1
2   1        CustomerId       INTEGER       1         NA  0
3   2       InvoiceDate      DATETIME       1         NA  0
4   3    BillingAddress  NVARCHAR(70)       0         NA  0
5   4       BillingCity  NVARCHAR(40)       0         NA  0
6   5      BillingState  NVARCHAR(40)       0         NA  0
7   6    BillingCountry  NVARCHAR(40)       0         NA  0
8   7 BillingPostalCode  NVARCHAR(10)       0         NA  0
9   8             Total NUMERIC(10,2)       1         NA  0
👉 Table: InvoiceLine
  cid          name          type notnull dflt_value pk
1   0 InvoiceLineId       INTEGER       1         NA  1
2   1     InvoiceId       INTEGER       1         NA  0
3   2       TrackId       INTEGER       1         NA  0
4   3     UnitPrice NUMERIC(10,2)       1         NA  0
5   4      Quantity       INTEGER       1         NA  0
👉 Table: MediaType
  cid        name          type notnull dflt_value pk
1   0 MediaTypeId       INTEGER       1         NA  1
2   1        Name NVARCHAR(120)       0         NA  0
👉 Table: Playlist
  cid       name          type notnull dflt_value pk
1   0 PlaylistId       INTEGER       1         NA  1
2   1       Name NVARCHAR(120)       0         NA  0
👉 Table: PlaylistTrack
  cid       name    type notnull dflt_value pk
1   0 PlaylistId INTEGER       1         NA  1
2   1    TrackId INTEGER       1         NA  2
👉 Table: Track
  cid         name          type notnull dflt_value pk
1   0      TrackId       INTEGER       1         NA  1
2   1         Name NVARCHAR(200)       1         NA  0
3   2      AlbumId       INTEGER       0         NA  0
4   3  MediaTypeId       INTEGER       1         NA  0
5   4      GenreId       INTEGER       0         NA  0
6   5     Composer NVARCHAR(220)       0         NA  0
7   6 Milliseconds       INTEGER       1         NA  0
8   7        Bytes       INTEGER       0         NA  0
9   8    UnitPrice NUMERIC(10,2)       1         NA  0

🔍 Step 3. Query the Database

หลังสำรวจ database แล้ว เราสามารถ query ข้อมูลได้ด้วย 3 functions ได้แก่:

dbReadTable()
dbGetQuery()
dbSendQuery()

1️⃣ dbReadTable()

เราจะใช้ dbReadTable() เมื่อต้องการดึงข้อมูลทั้งหมดมาจาก table ที่ต้องการ

ตัวอย่างเช่น ดูข้อมูลทั้งหมดใน Genre:

# Query with dbReadTable()
dbReadTable(con,
            "Genre")

ผลลัพธ์:

   GenreId               Name
1        1               Rock
2        2               Jazz
3        3              Metal
4        4 Alternative & Punk
5        5      Rock And Roll
6        6              Blues
7        7              Latin
8        8             Reggae
9        9                Pop
10      10         Soundtrack
11      11         Bossa Nova
12      12     Easy Listening
13      13        Heavy Metal
14      14           R&B/Soul
15      15  Electronica/Dance
16      16              World
17      17        Hip Hop/Rap
18      18    Science Fiction
19      19           TV Shows
20      20   Sci Fi & Fantasy
21      21              Drama
22      22             Comedy
23      23        Alternative
24      24          Classical
25      25              Opera

2️⃣ dbGetQuery()

ในกรณีที่เราต้องการดูข้อมูลแบบเจาะจง เราจะใช้ dbGetQuery() ซึ่งต้องการ 2 arguments:

Connection ที่เชื่อมต่อกับ database
SQL query ที่กำหนดข้อมูลที่ต้องการจาก database

ตัวอย่างการใช้งาน #1 – ดึงข้อมูลลูกค้าที่มาจากบราซิล:

# Query with dbGetQuery() - example 1
dbGetQuery(con,
           "SELECT
              CustomerId,
              FirstName,
              LastName, Email
            FROM
              Customer
            WHERE
              country = 'Brazil';")

ผลลัพธ์:

  CustomerId FirstName  LastName                         Email
1          1      Luís Gonçalves          luisg@embraer.com.br
2         10   Eduardo   Martins      eduardo@woodstock.com.br
3         11 Alexandre     Rocha              alero@uol.com.br
4         12   Roberto   Almeida roberto.almeida@riotur.gov.br
5         13  Fernanda     Ramos      fernadaramos4@uol.com.br

ตัวอย่าง #2 – คำนวณยอดขายรวมของแต่ละประเทศ โดยเรียงจากมากไปน้อย:

# Query with dbGetQuery() - example 2
dbGetQuery(con,
           "SELECT
              BillingCountry,
              SUM(Total) AS TotalSales
            FROM
              Invoice
            GROUP BY
              BillingCountry
            ORDER BY
              TotalSales DESC;")

ผลลัพธ์:

   BillingCountry TotalSales
1             USA     523.06
2          Canada     303.96
3          France     195.10
4          Brazil     190.10
5         Germany     156.48
6  United Kingdom     112.86
7  Czech Republic      90.24
8        Portugal      77.24
9           India      75.26
10          Chile      46.62
11        Ireland      45.62
12        Hungary      45.62
13        Austria      42.62
14        Finland      41.62
15    Netherlands      40.62
16         Norway      39.62
17         Sweden      38.62
18          Spain      37.62
19         Poland      37.62
20          Italy      37.62
21        Denmark      37.62
22        Belgium      37.62
23      Australia      37.62
24      Argentina      37.62

ตัวอย่าง #3 – ดึงชื่อเพลงและชื่ออัลบัม 10 อันดับแรก:

# Query with dbGetQuery() - example 3
dbGetQuery(con,
           "SELECT
              T.Name AS TrackName,
              A.Title AS AlbumTitle
            FROM
              Track AS T
            JOIN
              Album AS A ON T.AlbumID = A.AlbumID
            LIMIT 10;")

ผลลัพธ์:

                                 TrackName                            AlbumTitle
1  For Those About To Rock (We Salute You) For Those About To Rock We Salute You
2                        Balls to the Wall                     Balls to the Wall
3                          Fast As a Shark                     Restless and Wild
4                        Restless and Wild                     Restless and Wild
5                     Princess of the Dawn                     Restless and Wild
6                    Put The Finger On You For Those About To Rock We Salute You
7                          Let's Get It Up For Those About To Rock We Salute You
8                         Inject The Venom For Those About To Rock We Salute You
9                               Snowballed For Those About To Rock We Salute You
10                              Evil Walks For Those About To Rock We Salute You

3️⃣ dbSendQuery()

dbSendQuery() ทำงานเหมือนกับ dbGetQuery() แต่ต่างกันที่ dbGetQuery() จะยังส่งข้อมูลใด ๆ กลับมาจนกว่าเราจะเรียกดูด้วย dbFetch()

ยกตัวอย่างเช่น ดูข้อมูลลูกค้า 10 รายชื่อแรกเมื่อเรียงตามนามสกุล:

# Send query
res <- dbSendQuery(con,
                   "SELECT
                      CustomerId,
                      LastName,
                      FirstName,
                      Email
                    FROM
                      Customer
                    ORDER BY
                      LastName
                    LIMIT 10;")

# Fetch results
dbFetch(res)

ผลลัพธ์:

   CustomerId   LastName FirstName                         Email
1          12    Almeida   Roberto roberto.almeida@riotur.gov.br
2          28    Barnett     Julia           jubarnett@gmail.com
3          39    Bernard   Camille      camille.bernard@yahoo.fr
4          18     Brooks  Michelle             michelleb@aol.com
5          29      Brown    Robert              robbrown@shaw.ca
6          21      Chase     Kathy           kachase@hotmail.com
7          26 Cunningham   Richard      ricunningham@hotmail.com
8          41     Dubois      Marc       marc.dubois@hotmail.com
9          34  Fernandes      João           jfernandes@yahoo.pt
10         30    Francis    Edward           edfrancis@yachoo.ca

เมื่อเราเรียกดูข้อมูลทั้งหมดแล้ว เราจะไม่สามารถเรียกดูซ้ำได้:

# Fetch results
dbFetch(res)

ผลลัพธ์:

> dbFetch(res)
[1] CustomerId LastName   FirstName  Email     
<0 rows> (or 0-length row.names)

ทั้งนี้ เราสามารถกำหนดจำนวนข้อมูลที่จะเรียกดูในแต่ละครั้งได้ เช่น:

# Send query
res <- dbSendQuery(con,
                   "SELECT
                      CustomerId,
                      LastName,
                      FirstName,
                      Email
                    FROM
                      Customer
                    ORDER BY
                      LastName
                    LIMIT 10;")

# Fetch five, twice
dbFetch(res, n = 5)
dbFetch(res, n = 5)
dbFetch(res, n = 5)

ผลลัพธ์:

> dbFetch(res, n = 5)
  CustomerId LastName FirstName                         Email
1         12  Almeida   Roberto roberto.almeida@riotur.gov.br
2         28  Barnett     Julia           jubarnett@gmail.com
3         39  Bernard   Camille      camille.bernard@yahoo.fr
4         18   Brooks  Michelle             michelleb@aol.com
5         29    Brown    Robert              robbrown@shaw.ca
> dbFetch(res, n = 5)
  CustomerId   LastName FirstName                    Email
1         21      Chase     Kathy      kachase@hotmail.com
2         26 Cunningham   Richard ricunningham@hotmail.com
3         41     Dubois      Marc  marc.dubois@hotmail.com
4         34  Fernandes      João      jfernandes@yahoo.pt
5         30    Francis    Edward      edfrancis@yachoo.ca
> dbFetch(res, n = 5)
[1] CustomerId LastName   FirstName  Email     
<0 rows> (or 0-length row.names)

เราสามารถใช้ dbSendQuery() และ dbFetch() เพื่อดูข้อมูลเป็นชุด ๆ แทนที่จะดูข้อมูลทั้งหมดในครั้งเดียวแบบ dbGetQuery()

Note: ในกรณีที่เราต้องการลบ query ที่เราส่งไป database ด้วย dbSendQuery() ให้เราใช้ dbClearResult():

# Clear results
dbClearResult(res)

🤚 Step 4. Close the Connection

สุดท้าย เมื่อเราทำงานกับ database เสร็จแล้ว เราต้องสิ้นสุดการเชื่อมต่อกับ database ด้วย dbDisconnect():

# Close the connection
dbDisconnect(con)

เป็นอันจบการทำงานกับ database ด้วย DBI

💪 Summary

ในบทความนี้ เราได้ไปดูวิธีการใช้งาน DBI เพื่อทำงานกับ database กัน:

เชื่อมต่อ database:

dbConnect()

สำรวจ database:

dbListTables()
dbGetQuery()

Query ข้อมูล:

dbReadTable()
dbGetQuery()
dbSendQuery(), dbFetch(), และ dbClearResult()

ปิดการเชื่อมต่อ:

dbDisconnect()

😺 GitHub

ดู code และ database ในบทความนี้ได้ที่ GitHub

📃 References

✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

📕 ขอฝากหนังสือเล่มแรกในชีวิตด้วยนะครับ 😆

🙋 ใครที่กำลังเรียนจิตวิทยาหรือทำงานสายจิตวิทยา และเบื่อที่ต้องใช้ software ราคาแพงอย่าง SPSS และ Excel เพื่อทำข้อมูล

💪 ผมขอแนะนำ R Book for Psychologists หนังสือสอนใช้ภาษา R เพื่อการวิเคราะห์ข้อมูลทางจิตวิทยา ที่เขียนมาเพื่อนักจิตวิทยาที่ไม่เคยมีประสบการณ์เขียน code มาก่อน

ในหนังสือ เราจะปูพื้นฐานภาษา R และพาไปดูวิธีวิเคราะห์สถิติที่ใช้บ่อยกัน เช่น:

Correlation
t-tests
ANOVA
Reliability
Factor analysis

🚀 เมื่ออ่านและทำตามตัวอย่างใน R Book for Psychologists ทุกคนจะไม่ต้องพึง SPSS และ Excel ในการทำงานอีกต่อไป และสามารถวิเคราะห์ข้อมูลด้วยตัวเองได้ด้วยความมั่นใจ

แล้วทุกคนจะแปลกใจว่า ทำไมภาษา R ง่ายขนาดนี้ 🙂‍↕️

👉 สนใจดูรายละเอียดหนังสือได้ที่ meb:

ดูรายละเอียดหนังสือ R Book for Psychologists

2025-10-02

sqldf(): แนะนำ function ในการทำงานกับ data frame ด้วย SQL ในภาษา R — ตัวอย่างจาก Cars93

ในบทความนี้ เราจะมาดูวิธีใช้ sqldf() ซึ่งเป็น function ที่ช่วยให้เราทำงานกับ data frame ในภาษา R ได้ด้วย SQL syntax และเหมาะกับคนที่คุ้นเคยกับการใช้ SQL ในการทำงานกัน

ถ้าพร้อมแล้ว ไปเริ่มกันเลย

🏁 Getting Started: Install & Load sqldf

ก่อนเริ่มใช้ sqldf() เราจะต้องติดตั้งและโหลด sqldf ซึ่งเป็น package ต้นทางของ sdldf() ด้วย install.packages() และ library() ตามลำดับ:

# Install sqldf
install.packages("sqldf")

# Load sqldf
library(sqldf)

Note:

เราใช้ install.packages() เพื่อติดตั้งแค่ครั้งเดียว
เราใช้ library() เพื่อโหลด sqldf ทุกครั้งที่เริ่ม session ใหม่

🏃‍♂️‍➡️ Using sqldf

sqldf() ต้องการ 1 argument คือ character ที่มี SQL query เช่น:

sqldf("SELECT * FROM df")

เราลองมาดูตัวอย่างการใช้ sqldf() กับ Cars93 dataset (จาก MASS package) ซึ่งมีข้อมูลรถ 93 คันที่ขายในปี ค.ศ. 1993:

# Install MASS
install.packages("MASS")

# Load MASS
library(MASS)

# Load the dataset
data(Cars93)

# View the dataset structure
str(Cars93)

ผลลัพธ์:

'data.frame':	93 obs. of  27 variables:
 $ Manufacturer      : Factor w/ 32 levels "Acura","Audi",..: 1 1 2 2 3 4 4 4 4 5 ...
 $ Model             : Factor w/ 93 levels "100","190E","240",..: 49 56 9 1 6 24 54 74 73 35 ...
 $ Type              : Factor w/ 6 levels "Compact","Large",..: 4 3 1 3 3 3 2 2 3 2 ...
 $ Min.Price         : num  12.9 29.2 25.9 30.8 23.7 14.2 19.9 22.6 26.3 33 ...
 $ Price             : num  15.9 33.9 29.1 37.7 30 15.7 20.8 23.7 26.3 34.7 ...
 $ Max.Price         : num  18.8 38.7 32.3 44.6 36.2 17.3 21.7 24.9 26.3 36.3 ...
 $ MPG.city          : int  25 18 20 19 22 22 19 16 19 16 ...
 $ MPG.highway       : int  31 25 26 26 30 31 28 25 27 25 ...
 $ AirBags           : Factor w/ 3 levels "Driver & Passenger",..: 3 1 2 1 2 2 2 2 2 2 ...
 $ DriveTrain        : Factor w/ 3 levels "4WD","Front",..: 2 2 2 2 3 2 2 3 2 2 ...
 $ Cylinders         : Factor w/ 6 levels "3","4","5","6",..: 2 4 4 4 2 2 4 4 4 5 ...
 $ EngineSize        : num  1.8 3.2 2.8 2.8 3.5 2.2 3.8 5.7 3.8 4.9 ...
 $ Horsepower        : int  140 200 172 172 208 110 170 180 170 200 ...
 $ RPM               : int  6300 5500 5500 5500 5700 5200 4800 4000 4800 4100 ...
 $ Rev.per.mile      : int  2890 2335 2280 2535 2545 2565 1570 1320 1690 1510 ...
 $ Man.trans.avail   : Factor w/ 2 levels "No","Yes": 2 2 2 2 2 1 1 1 1 1 ...
 $ Fuel.tank.capacity: num  13.2 18 16.9 21.1 21.1 16.4 18 23 18.8 18 ...
 $ Passengers        : int  5 5 5 6 4 6 6 6 5 6 ...
 $ Length            : int  177 195 180 193 186 189 200 216 198 206 ...
 $ Wheelbase         : int  102 115 102 106 109 105 111 116 108 114 ...
 $ Width             : int  68 71 67 70 69 69 74 78 73 73 ...
 $ Turn.circle       : int  37 38 37 37 39 41 42 45 41 43 ...
 $ Rear.seat.room    : num  26.5 30 28 31 27 28 30.5 30.5 26.5 35 ...
 $ Luggage.room      : int  11 15 14 17 13 16 17 21 14 18 ...
 $ Weight            : int  2705 3560 3375 3405 3640 2880 3470 4105 3495 3620 ...
 $ Origin            : Factor w/ 2 levels "USA","non-USA": 2 2 2 2 2 1 1 1 1 1 ...
 $ Make              : Factor w/ 93 levels "Acura Integra",..: 1 2 4 3 5 6 7 9 8 10 ...

1️⃣ Example 1. SELECT

เลือกข้อมูลจาก columns Manufacturer, Model, Min.Price, และ Max.Price:

# Set query
select_query <- "
SELECT
  Manufacturer,
  Model,
  `Min.Price`,
  `Max.Price`
FROM
  Cars93
"

# Select from df
select_result <- sqldf(select_query)

# View the result
select_result

Note: เราใช้ backticks (`) สำหรับชื่อ columns ที่ไม่ valid ใน SQL (เช่น column ที่มี . อย่าง Min.Price และ Max.Price)

ผลลัพธ์:

    Manufacturer          Model Min.Price Max.Price
1          Acura        Integra      12.9      18.8
2          Acura         Legend      29.2      38.7
3           Audi             90      25.9      32.3
4           Audi            100      30.8      44.6
5            BMW           535i      23.7      36.2
6          Buick        Century      14.2      17.3
7          Buick        LeSabre      19.9      21.7
8          Buick     Roadmaster      22.6      24.9
9          Buick        Riviera      26.3      26.3
10      Cadillac        DeVille      33.0      36.3
11      Cadillac        Seville      37.5      42.7
12     Chevrolet       Cavalier       8.5      18.3
13     Chevrolet        Corsica      11.4      11.4
14     Chevrolet         Camaro      13.4      16.8
15     Chevrolet         Lumina      13.4      18.4
16     Chevrolet     Lumina_APV      14.7      18.0
17     Chevrolet          Astro      14.7      18.6
18     Chevrolet        Caprice      18.0      19.6
19     Chevrolet       Corvette      34.6      41.5
20      Chrylser       Concorde      18.4      18.4
21      Chrysler        LeBaron      14.5      17.1
22      Chrysler       Imperial      29.5      29.5
23         Dodge           Colt       7.9      10.6
24         Dodge         Shadow       8.4      14.2
25         Dodge         Spirit      11.9      14.7
26         Dodge        Caravan      13.6      24.4
27         Dodge        Dynasty      14.8      16.4
28         Dodge        Stealth      18.5      33.1
29         Eagle         Summit       7.9      16.5
30         Eagle         Vision      17.5      21.2
31          Ford        Festiva       6.9       7.9
32          Ford         Escort       8.4      11.9
33          Ford          Tempo      10.4      12.2
34          Ford        Mustang      10.8      21.0
35          Ford          Probe      12.8      15.2
36          Ford       Aerostar      14.5      25.3
37          Ford         Taurus      15.6      24.8
38          Ford Crown_Victoria      20.1      21.7
39           Geo          Metro       6.7      10.0
40           Geo          Storm      11.5      13.5
41         Honda        Prelude      17.0      22.7
42         Honda          Civic       8.4      15.8
43         Honda         Accord      13.8      21.2
44       Hyundai          Excel       6.8       9.2
45       Hyundai        Elantra       9.0      11.0
46       Hyundai         Scoupe       9.1      11.0
47       Hyundai         Sonata      12.4      15.3
48      Infiniti            Q45      45.4      50.4
49         Lexus          ES300      27.5      28.4
50         Lexus          SC300      34.7      35.6
51       Lincoln    Continental      33.3      35.3
52       Lincoln       Town_Car      34.4      37.8
53         Mazda            323       7.4       9.1
54         Mazda        Protege      10.9      12.3
55         Mazda            626      14.3      18.7
56         Mazda            MPV      16.6      21.7
57         Mazda           RX-7      32.5      32.5
58 Mercedes-Benz           190E      29.0      34.9
59 Mercedes-Benz           300E      43.8      80.0
60       Mercury          Capri      13.3      15.0
61       Mercury         Cougar      14.9      14.9
62    Mitsubishi         Mirage       7.7      12.9
63    Mitsubishi       Diamante      22.4      29.9
64        Nissan         Sentra       8.7      14.9
65        Nissan         Altima      13.0      18.3
66        Nissan          Quest      16.7      21.5
67        Nissan         Maxima      21.0      22.0
68    Oldsmobile        Achieva      13.0      14.0
69    Oldsmobile  Cutlass_Ciera      14.2      18.4
70    Oldsmobile     Silhouette      19.5      19.5
71    Oldsmobile   Eighty-Eight      19.5      21.9
72      Plymouth          Laser      11.4      17.4
73       Pontiac         LeMans       8.2       9.9
74       Pontiac        Sunbird       9.4      12.8
75       Pontiac       Firebird      14.0      21.4
76       Pontiac     Grand_Prix      15.4      21.6
77       Pontiac     Bonneville      19.4      29.4
78          Saab            900      20.3      37.1
79        Saturn             SL       9.2      12.9
80        Subaru          Justy       7.3       9.5
81        Subaru         Loyale      10.5      11.3
82        Subaru         Legacy      16.3      22.7
83        Suzuki          Swift       7.3      10.0
84        Toyota         Tercel       7.8      11.8
85        Toyota         Celica      14.2      22.6
86        Toyota          Camry      15.2      21.2
87        Toyota         Previa      18.9      26.6
88    Volkswagen            Fox       8.7       9.5
89    Volkswagen        Eurovan      16.6      22.7
90    Volkswagen         Passat      17.6      22.4
91    Volkswagen        Corrado      22.9      23.7
92         Volvo            240      21.8      23.5
93         Volvo            850      24.8      28.5

2️⃣ Example 2. WHERE

คัดกรองข้อมูลรถที่ชื่อผู้ผลิตขึ้นต้นด้วย “M”:

# Set query
where_result <- "
SELECT
  Manufacturer,
  Model,
  `Min.Price`,
  `Max.Price`
FROM
  Cars93
WHERE
  Manufacturer LIKE 'M%'
"

# Filter df
where_result <- sqldf(where_result)

# View the result
where_result

ผลลัพธ์:

    Manufacturer    Model Min.Price Max.Price
1          Mazda      323       7.4       9.1
2          Mazda  Protege      10.9      12.3
3          Mazda      626      14.3      18.7
4          Mazda      MPV      16.6      21.7
5          Mazda     RX-7      32.5      32.5
6  Mercedes-Benz     190E      29.0      34.9
7  Mercedes-Benz     300E      43.8      80.0
8        Mercury    Capri      13.3      15.0
9        Mercury   Cougar      14.9      14.9
10    Mitsubishi   Mirage       7.7      12.9
11    Mitsubishi Diamante      22.4      29.9

3️⃣ Example 3. Aggregate

หารถ 10 อันดับแรกที่มีราคาสูงสุด:

# Set query
aggregate_query <- "
SELECT
  Manufacturer,
  AVG(Price) AS Avg_Price
FROM
  Cars93
GROUP BY
  Manufacturer
ORDER BY
  Avg_Price DESC
LIMIT
  10;
"

# Aggregate df
aggregate_result <- sqldf(aggregate_query)

# View the result
aggregate_result

ผลลัพธ์:

    Manufacturer Avg_Price
1       Infiniti      47.9
2  Mercedes-Benz      46.9
3       Cadillac      37.4
4        Lincoln      35.2
5           Audi      33.4
6          Lexus      31.6
7            BMW      30.0
8           Saab      28.7
9          Acura      24.9
10         Volvo      24.7

😺 GitHub

ดูตัวอย่าง code ทั้งหมดได้ที่ GitHub

📃 References

✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

📕 ขอฝากหนังสือเล่มแรกในชีวิตด้วยนะครับ 😆

Correlation
t-tests
ANOVA
Reliability
Factor analysis

แล้วทุกคนจะแปลกใจว่า ทำไมภาษา R ง่ายขนาดนี้ 🙂‍↕️

👉 สนใจดูรายละเอียดหนังสือได้ที่ meb:

ดูรายละเอียดหนังสือ R Book for Psychologists

2025-09-25

Seven SQL: 7 คำสั่ง SQL พื้นฐานในการทำงานกับ Database สำหรับผู้เริ่มต้น พร้อมตัวอย่างจาก Chinook Database

SQL ย่อมาจาก Structured Query Language เป็นภาษาที่ใช้ทำงานกับ database และถูกพัฒนาโดย IBM ในช่วง ค.ศ. 1970s

แม้ SQL จะมีมานานแล้ว แต่ SQL ยังเป็นทักษะที่สำคัญในยุคนี้ที่ data เป็น resource ที่สำคัญ ทั้งในการใช้ชีวิตและการทำงาน

ถ้าเราใช้ SQL เป็น เราจะสามารถ:

สร้างและจัดการ database
เรียกดูข้อมูลจาก database
จัดการข้อมูลบน database
วิเคราะห์ข้อมูลบน database

ในบทความนี้ เราจะทำความรู้จักกับ 7 คำสั่ง SQL ที่สำคัญ ผ่านตัวอย่างของ Chinook database กัน:

SELECT
WHERE
ORDER BY
GROUP BY
Aggregate functions
JOIN
LIMIT

(พร้อม best practices แนะนำ resources ในการพัฒนา SQL ต่อ)

ถ้าพร้อมแล้วไปเริ่มกันเลย

💽 Example Database: Chinook

สำหรับบทความนี้ เราจะใช้ Chinook database ซึ่งเป็น database ที่มักใช้ฝึก SQL เป็นตัวอย่างกัน

Chinook database เป็นข้อมูลร้านขายมีเดียออนไลน์ และแบ่งออกเป็น 11 ชุดข้อมูล (tables):

No.	Table Name	Description
1	`Album`	ข้อมูลอัลบัม
2	`Artist`	ข้อมูลศิลปิน
3	`Customer`	ข้อมูลลูกค้า
4	`Employee`	ข้อมูลพนักงาน
5	`Genre`	ข้อมูลแนวเพลง
6	`Invoice`	ข้อมูลใบเสร็จขายของ
7	`InvoiceLine`	ข้อมูลรายการซื้อในใบเสร็จ
8	`MediaType`	ข้อมูลประเภทมีเดีย
9	`Playlist`	ข้อมูลเพลย์ลิสต์
10	`PlaylistTrack`	ข้อมูลสำหรับจับคู่เพลย์ลิสต์กับเพลง
11	`Track`	ข้อมูลเพลง

เรามาดูวิธีเขียน 7 คำสั่ง SQL กันด้วย Chinook database กัน

1️⃣ Statement #1: SELECT

Usage:

คำสั่งพื้นฐาน สำหรับเลือกข้อมูลจาก database

Syntax:

			
SELECT columns
FROM table

columns ให้ระบุชื่อ columns ที่เราต้องการ (ระบุได้มากกว่า 1 โดยใช้ , คั่น)
table ให้ระบุ ชื่อ table ที่มีข้อมูลที่เราต้องการ

Example:

เลือกดูชื่อเพลง (Name) และรหัสอัลบัม (AlbumID) จาก Track:

SELECT Name, AlbumId
FROM Track;

ผลลัพธ์:

Note:

เราสามารถเลือกข้อมูลทั้งหมดจาก table ได้ โดยใช้ * เช่น:

SELECT *
FROM Tracks;

โดยผลลัพธ์จะแสดงข้อมูลทุก columns และ rows ใน Track

นอกจากนี้ เราสามารถตั้งชื่อ column ได้ โดยใช้ AS เช่น:

SELECT Name AS Song, AlbumId AS Album
FROM Track;

ผลลัพธ์:

จะเห็นว่า ข้อมูลจะเหมือนเดิม แต่ชื่อ column จะเปลี่ยนไป

2️⃣ Statement #2: WHERE

Usage:

ใช้กรองข้อมูลที่เรียกมาแสดง

Syntax:

WHERE conditions

conditions ให้ระบุเงื่อนไขในการกรอง

Example:

หาเพลงที่มีราคา (UnitPrice) สูงกว่า $0.99:

SELECT Name, UnitPrice
FROM Track
WHERE UnitPrice > 0.99;

ผลลัพธ์:

WHERE operators:

ในการกรอง เราสามารถใช้ operators เหล่านี้ในการกำหนดเงื่อนไขได้:

Operator	Meaning	Example
`=`	เท่ากับ	`UnitPrice = 0.99`
`<>` หรือ `!=`	ไม่เท่ากับ	`UnitPrice <> 0.99`
`>`	มากกว่า	`UnitPrice > 0.99`
`<`	น้อยกว่า	`UnitPrice < 0.99`
`>=`	มากกว่า/เท่ากับ	`UnitPrice >= 0.99`
`<=`	น้อยกว่า/เท่ากับ	`UnitPrice <= 0.99`
`BETWEEN`	กรองข้อมูลตามช่วง	`UnitPrice BETWEEN 0.99 and 1.99`
`IN`	กรองข้อมูลตามเซตข้อมูล	`UnitPrice IN (0.99, 1.99, 2.99)`

นอกจากนี้ เรายังสามารถใช้ LIKE กับ WHERE เพื่อกรอง text ได้อีกด้วย

โดย LIKE ใช้คู่กับ 2 อย่าง:

Operator	Meaning
`_`	แทน 1 characters
`%`	แทน 0, 1, หรือมากกว่า 1 characters

เช่น:

SELECT FirstName, LastName
FROM Customer
WHERE FirstName LIKE '_ohn';

ผลลัพธ์:

ผลลัพธ์: เราจะได้ข้อมูลทั้งหมดที่มี FirstName ขึ้นต้นด้วยตัวอักษรใด ๆ 1 ตัว + “ohn”

เช่น:

John
Gohn
Wohn

อย่างในตัวอย่าง เราจะได้ “John Gordon” ขึ้นมา:

หรือ:

SELECT FirstName, LastName
FROM Customer
WHERE FirstName LIKE 'J%';

ผลลัพธ์:

เราจะได้ข้อมูลที่ FirstName เริ่มด้วย J และตามด้วยตัวอักษรใด ๆ + กี่ตัวก็ได้

เช่น:

John
Jo
Jane
James

อย่างในตัวอย่าง เราจะได้ชื่อเหล่านี้มา:

3️⃣ Statement #3: ORDER BY

Usage:

จัดลำดับข้อมูล

Syntax:

ORDER BY columns

columns ให้ระบุชื่อ column ที่ใช้ในการจัดลำดับ (ใส่ได้มากกว่า 1)

Example:

ดึงรายชื่อลูกค้า ให้แสดงตามชื่อจริง (FirstName):

SELECT FirstName, LastName
FROM Customer
ORDER BY FirstName;

ผลลัพธ์:

Note:

Default ของ ORDER BY จะเป็นการเรียงแบบ ascending (A-Z)

ถ้าเราอยากเรียงแบบ descending (Z-A) ให้ใส่ DESC ต่อท้าย เช่น:

SELECT FirstName, LastName
FROM Customer
ORDER BY FirstName DESC;

ผลลัพธ์:

4️⃣ Statement #4: GROUP BY

Usage:

จับกลุ่มข้อมูล

Syntax:

GROUP BY columns

columns ระบุชื่อ column ที่ใช้จับกลุ่ม (ระบุได้มากกว่า 1)

Example:

นับจำนวนเพลงในแต่ละอัลบัม:

SELECT AlbumId, COUNT(*) AS TrackCount
FROM Track
GROUP BY AlbumId;

ผลลัพธ์:

จากตัวอย่าง เราจะเห็นว่า album ที่ 1 มี 10 เพลง, album ที่ 2 มี 1 เพลง, ไปเรื่อย ๆ

5️⃣ Statement #5: Aggregate Functions

Usage:

สรุป (aggregate) ข้อมูล

Syntax:

SELECT agg(column)

agg ให้ระบุ aggregate function ที่ต้องการใช้งาน
column ให้ระบุชื่อ column ที่เป็น input ของ aggregate function

Common aggregate functions:

ใน SQL, เรามี 5 aggregate functions ที่มักใช้บ่อย ได้แก่:

No.	Aggregate	Description
1	`COUNT()`	นับจำนวนข้อมูล
2	`SUM()`	หาผลรวม (sum)
3	`AVG()`	หาค่าเฉลี่ย (mean)
4	`MIN()`	หาค่าต่ำสุด
5	`MAX()`	หาค่าสูงสุด

Example:

เราต้องการรู้ข้อมูลการใช้จ่ายของลูกค้าแต่ละคน

โดยเราต้องการรู้:

จำนวนครั้งในการซื้อ (count)
เงินที่เคยใช้จ่ายทั้งหมด (sum)
ค่าใช้จ่ายโดยเฉลี่ย (mean)

SELECT CustomerId, COUNT(*), SUM(Total) AS TotalSpent, AVG(Total) AS AverageSpent
FROM Invoice
GROUP BY CustomerId;

ผลลัพธ์:

Note:

เพื่อให้ข้อมูลอ่านง่าย เราสามารถใช้ ROUND() เพื่อกำหนดจุดทศนิยมได้ เช่น:

SELECT CustomerId, COUNT(*), ROUND(SUM(Total), 2) AS TotalSpent, ROUND(AVG(Total), 2) AS AverageSpent
FROM Invoice
GROUP BY CustomerId;

ผลลัพธ์:

สังเกตว่า ข้อมูลใน TotalSpent และ AverageSpent จะแสดงทศนิยมแค่ 2 ตำแหน่ง

6️⃣ Statement #6: JOIN

Usage:

เชื่อม tables เข้าด้วยกัน

Syntax:

			
SELECT columns
FROM table1
JOIN table2
ON table1.key1 on table2.key2

table1, table2 คือ tables ที่เราต้องการเชื่อมกัน
key1, key2 คือ column ที่ใช้ระบุว่า ข้อมูลไหนจะเชื่อมกับข้อมูลไหน (primary key, foreign key)

Example:

เราอยากรู้ว่าเพลงไหนอยู่ในอัลบัลอะไร ให้เชื่อม Track เข้ากับ Album เพื่อหาคำตอบ:

SELECT Track.Name AS TrackName, Album.Title AS AlbumName
FROM Track
JOIN Album
ON Track.AlbumId = Album.AlbumId;

ผลลัพธ์:

7️⃣ Statement #7: LIMIT

Usage:

จำกัดจำนวนข้อมูลที่จะแสดง

Syntax:

LIMIT x

x ให้ใส่จำนวนที่ต้องการ

Example:

SELECT FirstName, LastName
FROM Customer
LIMIT 10;

ผลลัพธ์:

💪Put It All Together

เราสามารถใช้คำสั่ง SQL ทั้งหมดร่วมกัน เพื่อตอบโจทย์ data ที่ซับซ้อนได้

ตัวอย่างเช่น หา 5 อัลบัมที่ขายดีที่สุด ซึ่งมีเพลงราคาตั้งแต่ $0.99 ขึ้นไป:

SELECT Album.Title AS AlbumName, SUM(Track.UnitPrice) AS TotalRevenue
FROM Album
JOIN Track
ON Album.AlbumId = Track.AlbumId
WHERE Track.UnitPrice > 0.99
GROUP BY Album.AlbumId
ORDER BY TotalRevenue DESC
LIMIT 5;

เราใช้ SELECT เพื่อเลือกชื่ออัลบัมและหาผลรวมยอดขาย (SUM)
เชื่อม tables (JOIN) เพื่อดึงข้อมูลราคาเพลง จาก Track
กรองข้อมูลเฉพาะเพลงที่มีราคาตั้งแต่ $0.99 (WHERE)
จับกลุ่มข้อมูล (GROUP BY) เพื่อหาผลรวมของแต่ละอัลบัม
จัดเรียงข้อมูล (ORDER BY) ตามผลรวมยอดขาย จากมากไปน้อย (DESC)
เลือกแสดงข้อมูล 5 อันดับแรก (LIMIT)

ผลลัพธ์:

🍩 Bonus: SQL Best Practice

เพื่อเป็นความรู้เพิ่มเติม มาดู 3 best practices ในการเขียน SQL กัน:

ใช้ UPPERCASE ในเขียนคำสั่ง เช่น:
1. ✅ Do: SELECT, WHERE, GROUP BY
2. ❌ Don’t: select, where, group by
ใช้ snake_case ในการตั้งชื่อ tables และ columns เช่น:
1. user_id
2. order_date
3. duration_ms
ใช้ indentation (เคาะย่อหน้า) และแบ่งบรรทัด เพื่อความอ่านง่าย เช่น:

-- เขียนแบบนี้:

SELECT
	FirstName,
	LastName
FROM Customer
ORDER BY LastName;

-- แทนแบบนี้:
SELECT FirstName, LastName
FROM Customer
ORDER BY LastName;

Note:

จะเห็นว่า ตัวอย่างในบทความ ยังไม่ได้ทำตาม ข้อ 2 และ 3 😅
อ่าน best practices อื่น ๆ เพิ่มเติมได้ที่ SQL Style Guide

⏭️Next: Sharpen Your SQL

😺 GitHub

ดู database และตัวอย่าง SQL ทั้งหมดในบทความ ได้ที่ GitHub

🔨 Free Tool

สำหรับใครที่อยากเริ่มฝึก SQL สามารถใช้ SQL ได้ฟรี ผ่าน https://sqliteonline.com/

🎒 Free Course

สำหรับคนที่สนใจเรียน SQL แนะนำคอร์สเรียน SQL Crash Course จาก DataRockie

ง่าย
ฟรี
ใช้เวลาเรียนเพียง 30 นาที
ได้ certificate หลังเรียนจบ

📖 Free Tutorial

สำหรับใครที่อยากศึกษาคำสั่ง SQL นอกเหนือจากนี้ สามารถอ่านเพิ่มได้ที่ SQL Tutorial จาก W3Schools

ฟรี
เข้าใจง่าย

📃 References

2025-01-23

Tag: SQL

dbplyr: แนะนำ package และ 6 ขั้นตอนในการทำงานกับ database ด้วย dplyr syntax ในภาษา R — ตัวอย่างการทำงานกับ Chinook database

🤔 What Is dbplyr?

🏁 Getting Started

🏃‍♂️‍➡️ Using dbplyr

1️⃣ Connect to the Database

2️⃣ Create a Lazy Tibble

3️⃣ Create a Query

4️⃣ Show the Query

5️⃣ Collect the Result

6️⃣ Disconnect the Database

💪 Summary

😺 GitHub

📃 References

✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

Share this:

DBI: แนะนำ 4 ขั้นตอนในการเชื่อมต่อและ query ข้อมูลจาก database โดยใช้ภาษา R — ตัวอย่างการทำงานกับ Chinook database

💻 Step 1. Get Started

📦 DBI Package

⬇️ Install & Connect

👀 Step 2. Explore the Database

1️⃣ dbListTable()

2️⃣ dbGetQuery()

🔍 Step 3. Query the Database

1️⃣ dbReadTable()

2️⃣ dbGetQuery()

3️⃣ dbSendQuery()

🤚 Step 4. Close the Connection

💪 Summary

😺 GitHub

📃 References

✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

Share this:

sqldf(): แนะนำ function ในการทำงานกับ data frame ด้วย SQL ในภาษา R — ตัวอย่างจาก Cars93

🏁 Getting Started: Install & Load sqldf

🏃‍♂️‍➡️ Using sqldf

1️⃣ Example 1. SELECT

2️⃣ Example 2. WHERE

3️⃣ Example 3. Aggregate

😺 GitHub

📃 References

✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

Share this:

Seven SQL: 7 คำสั่ง SQL พื้นฐานในการทำงานกับ Database สำหรับผู้เริ่มต้น พร้อมตัวอย่างจาก Chinook Database

💽 Example Database: Chinook

1️⃣ Statement #1: SELECT

2️⃣ Statement #2: WHERE

3️⃣ Statement #3: ORDER BY

4️⃣ Statement #4: GROUP BY

5️⃣ Statement #5: Aggregate Functions

6️⃣ Statement #6: JOIN

7️⃣ Statement #7: LIMIT

💪Put It All Together

🍩 Bonus: SQL Best Practice

⏭️Next: Sharpen Your SQL

😺 GitHub

🔨 Free Tool

🎒 Free Course

📖 Free Tutorial

📃 References

Share this: