English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

R-Datenanpassung R-Faktoren

R-Datenrahmen

Der Datenrahmen (Data frame) kann als "Tabelle" verstanden werden, die wir oft sagen.

Der Datenrahmen ist eine Datenstruktur in der R-Sprache, eine spezielle zwei维Liste.

Jede Spalte im Datenrahmen hat einen eindeutigen Spaltennamen, die Längen sind gleich, der Datentyp der gleiche Spalte muss konsistent sein, der Datentyp verschiedener Spalten kann unterschiedlich sein.

R-Sprach-Datenrahmen werden mit der Funktion data.frame() erstellt, die Syntax ist wie folgt:

data.frame(…, row.names = NULL, check.rows = FALSE,
　　　　　　　　　　　check.names = TRUE, fix.empty.names = TRUE,
　　　　　　　　　　　stringsAsFactors = default.stringsAsFactors())

...: Die Spaltenvektoren können jeden Typ sein (Zeichen, numerisch, logisch), sie werden in der Regel im Format tag = value dargestellt oder nur value.
row.names: Der Name der Zeile, standardmäßig NULL, kann auf einen einzigen Zahl, String oder einen Vektor aus String und Zahl gesetzt werden.
check.rows: 检测行的名称和长度是否一致。
: Überprüft, ob die Namen der Zeilen und die Längen übereinstimmen.: Überprüft, ob die Namen der Zeilen und die Längen übereinstimmen.
check.names: Überprüft, ob die Variablennamen des Datenframes gültig sind.
fix.empty.names: Setzt fest, ob unbenannte Parameter automatisch benannt werden sollen.-stringsAsFactors

: Boolean, ob Zeichenfolgen in Faktoren umgewandelt werden sollen. factory

Beispiel

table　=　data.frame(
　　　　Wir können auch spezifische Spalten extrahieren:
　　　　Arbeitsnummer　=　c("001","002
　　　　Monatsgehalt　=　c(1000,　2000)
　　　　
)
fresh Standardwert ist TRUE, kann durch Einstellen der Option (stringsAsFactors=FALSE) geändert werden.

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

Name　Arbeitsnummer　Monatsgehalt
1　Zhang San　　001　1000
2　Li Si　　002　2000

folgend erstellt werden: print(table) # table Daten ansehen Die Datenstruktur des Datenframes kann durch

Beispiel

table　=　data.frame(
　　　　Wir können auch spezifische Spalten extrahieren:
　　　　Arbeitsnummer　=　c("001","002
　　　　Monatsgehalt　=　c(1000,　2000)
)
str()
Funktion anzuzeigen:

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

# Datenstruktur erhalten　　　2　str(table)　　3　'data.frame':
　obs. von
　variables:1$ Name: chr "Zhang San" "Li Si"2Ausgabe der ersten zwei Zeilen
　$ Arbeitsnummer: chr "00　　1000　2000

" "00 $ Monatsgehalt: num

Beispiel

table　=　data.frame(
　　　　Wir können auch spezifische Spalten extrahieren:
　　　　Arbeitsnummer　=　c("001","002
　　　　Monatsgehalt　=　c(1000,　2000)
　　　　
)
Zusammenfassung()
# Anzeigen der Zusammenfassung

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

print(summary(table))　　　　　
Name                 Arbeitsnummer                 Monatsgehalt2　　　　　　　　　　　Name                 Arbeitsnummer                 Monatsgehalt2　　　　　　　　　　　Length:1000　　
Min. :　　　1Class :character Class :character1250　　
st Qu. :1500　　
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　Mode :character Mode :character Median :1500　　
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　3Mean :1750　　
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　rd Qu. :2000

Max. :

Beispiel

table　=　data.frame(
　　　　Wir können auch spezifische Spalten extrahieren:
　　　　Arbeitsnummer　=　c("001","002
　　　　Monatsgehalt　=　c(1000,　2000)
)
Name = c("Zhang San", "Li Si"),
result　<-　# Extrahieren spezifischer Spalten
print(result)

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

data.frame(table$姓名,table$月薪)
1　　　　　　　table.姓名 table.月薪　　　　　　　1000
2　　　　　　　Zhang San　　　　　　　2000

Li Si

Beispiel

table　=　data.frame(
　　　　Name　=　c("Zhang San",　"Li Si","Wang Wu"),
　　　　Arbeitsnummer　=　c("001","002","003
　　　　Monatsgehalt　=　c(1000,　2000,3000)
)
print(table)
Die folgenden Form zeigt die ersten zwei Zeilen an:
# Extrahieren der ersten zwei Zeilen---] "----print("
result　<-　))1table[2:
print(result)

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

Name　Arbeitsnummer　Monatsgehalt
1　Zhang San　　001　1000
2　Li Si　　002　2000
3　Wang Wu　　003　3000
[1,]---] "----Ausgabe der ersten zwei Zeilen
　　Name　Arbeitsnummer　Monatsgehalt
1　Zhang San　　001　1000
2　Li Si　　002　2000

" 2 、3 # Lesen der Spalte 1 、2 Wir können Daten einer bestimmten Spalte in einer bestimmten Zeile lesen, wie folgt lesen wir die

Beispiel

table　=　data.frame(
　　　　Name　=　c("Zhang San",　"Li Si","Wang Wu"),
　　　　Arbeitsnummer　=　c("001","002","003
　　　　Monatsgehalt　=　c(1000,　2000,3000)
)
# Lesen der Spalte　2　、3　# Lesen der Spalte　1　、2　Spalten Daten：
result　<-　table[c(2,3),c(1,2)]
print(result)

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

Name Arbeitsnummer
2　Li Si　　002
3　Wang Wu　　003

Erweiterung des Datenframes

Wir können bestehende Datenframes erweitern. Im folgenden Beispiel fügen wir eine Abteilungs列 hinzu:

Beispiel

table　=　data.frame(
　　　　Name　=　c("Zhang San",　"Li Si","Wang Wu"),
　　　　Arbeitsnummer　=　c("001","002","003
　　　　Monatsgehalt　=　c(1000,　2000,3000)
)
# Hinzufügen der Abteilungs列
table$Abteilung <-　c("Betrieb","Technik","Redaktion")
print(table)

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

Name Arbeitsnummer Monatsgehalt Abteilung
1　Zhang San　　001　1000 Betrieb
2　Li Si　　002　2000　Technik
3　Wang Wu　　003　3000　Bearbeitung

Man kann cbind() Funktion, mehrere Vektoren zu einem Datenrahmen zusammenzufügen：

Beispiel

#　Vektoren erstellen
sites　<-　c("Google","w3codebox","Taobao")
likes　<-　c(222,111,123)
url　<-　c("www.google.com","de.oldtoolbag.com,"www.taobao.com")
#　Vektoren zu einem Datenrahmen kombinieren
addresses　<-　cbind(sites,likes,url)
#　Datenrahmen anzeigen
print(addresses)

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

　　　　　sites　　　　likes　url　　　　　　　　　　　　　
[1,] "Google" "222"　"www.google.com"
[2,] "w3codebox" "111"　"de.oldtoolbag.com"
[3,] "Taobao" "123"　"www.taobao.com"

Um zwei Datenrahmen zu kombinieren, kann man rbind() Funktion：

Beispiel

table　=　data.frame(
　　　　Name　=　c("Zhang San",　"Li Si","Wang Wu"),
　　　　Arbeitsnummer　=　c("001","002","003
　　　　Monatsgehalt　=　c(1000,　2000,3000)
)
newtable　=　data.frame(
　　　　Name　=　c("Xiao Ming",　"Xiao Bai"),
　　　　Arbeitsnummer　=　c("101102
　　　　Monatsgehalt　=　c(5000,　7000)
)
#　Zwei Datenrahmen zusammenführen
result　<-　rbind(table,newtable)
print(result)

Das Ausführen des folgenden Codes gibt das Ergebnis aus：

Name　Arbeitsnummer　Monatsgehalt
1　Zhang San　　001　1000
2　Li Si　　002　2000
3　Wang Wu　　003　3000
4　Xiao Ming　　101　5000
5　Xiao Bai　　102　7000

R-Datenanpassung R-Faktoren