English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Der Datenrahmen (Data frame) kann als "Tabelle" verstanden werden, die wir oft sagen.
Der Datenrahmen ist eine Datenstruktur in der R-Sprache, eine spezielle zwei维Liste.
Jede Spalte im Datenrahmen hat einen eindeutigen Spaltennamen, die Längen sind gleich, der Datentyp der gleiche Spalte muss konsistent sein, der Datentyp verschiedener Spalten kann unterschiedlich sein.
R-Sprach-Datenrahmen werden mit der Funktion data.frame() erstellt, die Syntax ist wie folgt:
data.frame(…, row.names = NULL, check.rows = FALSE, check.names = TRUE, fix.empty.names = TRUE, stringsAsFactors = default.stringsAsFactors())
...: Die Spaltenvektoren können jeden Typ sein (Zeichen, numerisch, logisch), sie werden in der Regel im Format tag = value dargestellt oder nur value.
row.names: Der Name der Zeile, standardmäßig NULL, kann auf einen einzigen Zahl, String oder einen Vektor aus String und Zahl gesetzt werden.
check.rows: 检测行的名称和长度是否一致。
: Überprüft, ob die Namen der Zeilen und die Längen übereinstimmen.: Überprüft, ob die Namen der Zeilen und die Längen übereinstimmen.
check.names: Überprüft, ob die Variablennamen des Datenframes gültig sind.
fix.empty.names: Setzt fest, ob unbenannte Parameter automatisch benannt werden sollen.-stringsAsFactors
: Boolean, ob Zeichenfolgen in Faktoren umgewandelt werden sollen. factory
table = data.frame( Wir können auch spezifische Spalten extrahieren: Arbeitsnummer = c("001","002 Monatsgehalt = c(1000, 2000) ) fresh Standardwert ist TRUE, kann durch Einstellen der Option (stringsAsFactors=FALSE) geändert werden.
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
Name Arbeitsnummer Monatsgehalt 1 Zhang San 001 1000 2 Li Si 002 2000
folgend erstellt werden: print(table) # table Daten ansehen Die Datenstruktur des Datenframes kann durch
table = data.frame( Wir können auch spezifische Spalten extrahieren: Arbeitsnummer = c("001","002 Monatsgehalt = c(1000, 2000) ) str() Funktion anzuzeigen:
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
# Datenstruktur erhalten 2 str(table) 3 'data.frame': obs. von variables:1$ Name: chr "Zhang San" "Li Si"2Ausgabe der ersten zwei Zeilen $ Arbeitsnummer: chr "00 1000 2000
" "00 $ Monatsgehalt: num
table = data.frame( Wir können auch spezifische Spalten extrahieren: Arbeitsnummer = c("001","002 Monatsgehalt = c(1000, 2000) ) Zusammenfassung() # Anzeigen der Zusammenfassung
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
print(summary(table)) Name Arbeitsnummer Monatsgehalt2 Name Arbeitsnummer Monatsgehalt2 Length:1000 Min. : 1Class :character Class :character1250 st Qu. :1500 Mode :character Mode :character Median :1500 3Mean :1750 rd Qu. :2000
Max. :
table = data.frame( Wir können auch spezifische Spalten extrahieren: Arbeitsnummer = c("001","002 Monatsgehalt = c(1000, 2000) ) Name = c("Zhang San", "Li Si"), result <- # Extrahieren spezifischer Spalten print(result)
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
data.frame(table$姓名,table$月薪) 1 table.姓名 table.月薪 1000 2 Zhang San 2000
Li Si
table = data.frame( Name = c("Zhang San", "Li Si","Wang Wu"), Arbeitsnummer = c("001","002","003 Monatsgehalt = c(1000, 2000,3000) ) print(table) Die folgenden Form zeigt die ersten zwei Zeilen an: # Extrahieren der ersten zwei Zeilen---] "----print(" result <- ))1table[2: print(result)
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
Name Arbeitsnummer Monatsgehalt 1 Zhang San 001 1000 2 Li Si 002 2000 3 Wang Wu 003 3000 [1,]---] "----Ausgabe der ersten zwei Zeilen Name Arbeitsnummer Monatsgehalt 1 Zhang San 001 1000 2 Li Si 002 2000
" 2 、3 # Lesen der Spalte 1 、2 Wir können Daten einer bestimmten Spalte in einer bestimmten Zeile lesen, wie folgt lesen wir die
table = data.frame( Name = c("Zhang San", "Li Si","Wang Wu"), Arbeitsnummer = c("001","002","003 Monatsgehalt = c(1000, 2000,3000) ) # Lesen der Spalte 2 、3 # Lesen der Spalte 1 、2 Spalten Daten: result <- table[c(2,3),c(1,2)] print(result)
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
Name Arbeitsnummer 2 Li Si 002 3 Wang Wu 003
Wir können bestehende Datenframes erweitern. Im folgenden Beispiel fügen wir eine Abteilungs列 hinzu:
table = data.frame( Name = c("Zhang San", "Li Si","Wang Wu"), Arbeitsnummer = c("001","002","003 Monatsgehalt = c(1000, 2000,3000) ) # Hinzufügen der Abteilungs列 table$Abteilung <- c("Betrieb","Technik","Redaktion") print(table)
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
Name Arbeitsnummer Monatsgehalt Abteilung 1 Zhang San 001 1000 Betrieb 2 Li Si 002 2000 Technik 3 Wang Wu 003 3000 Bearbeitung
Man kann cbind() Funktion, mehrere Vektoren zu einem Datenrahmen zusammenzufügen:
# Vektoren erstellen sites <- c("Google","w3codebox","Taobao") likes <- c(222,111,123) url <- c("www.google.com","de.oldtoolbag.com,"www.taobao.com") # Vektoren zu einem Datenrahmen kombinieren addresses <- cbind(sites,likes,url) # Datenrahmen anzeigen print(addresses)
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
sites likes url [1,] "Google" "222" "www.google.com" [2,] "w3codebox" "111" "de.oldtoolbag.com" [3,] "Taobao" "123" "www.taobao.com"
Um zwei Datenrahmen zu kombinieren, kann man rbind() Funktion:
table = data.frame( Name = c("Zhang San", "Li Si","Wang Wu"), Arbeitsnummer = c("001","002","003 Monatsgehalt = c(1000, 2000,3000) ) newtable = data.frame( Name = c("Xiao Ming", "Xiao Bai"), Arbeitsnummer = c("101102 Monatsgehalt = c(5000, 7000) ) # Zwei Datenrahmen zusammenführen result <- rbind(table,newtable) print(result)
Das Ausführen des folgenden Codes gibt das Ergebnis aus:
Name Arbeitsnummer Monatsgehalt 1 Zhang San 001 1000 2 Li Si 002 2000 3 Wang Wu 003 3000 4 Xiao Ming 101 5000 5 Xiao Bai 102 7000